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La presente invention a pour objet des fragments d'ADN de Neisseria 
meningitidis codant pour les sous-unites du recepteur de la transferrin ainsi 
qu'un procede de fabrication de chacune des sous-unites par voie 
recombinante. 

D'une roaniere generate, les meningites sont soit d'origine virale, soit 
d'origine bacterienne. Les bacteries principalement responsables sont : N. 
meningitidis et Haemophilus influenzae, respectivement impliquees dans 
environ 40 et 50 % des cas de meningites bacteriennes. 

On denombre en France, environ 600 a 800 cas par an de meningites a 
■N. meningitidis. Aux Etats-Unis, le nombre de cas s'eleve a environ 2 500 a 3 
000 par an. 

15 L'espece N. meningitidis est subdivisee en serogroupes selon la nature 

des polysaccharides capsulaires. Bien qu'il existe une douzaine de 
serogroupes, 90 % des cas de meningites sont attribuables a 3 serogroupes : 
A,BetC. 

20 II existe des vaccins efficaces a base de polysaccharides capsulaires 

pour prevenir les meningites a M meningitidis serogroupes A et C Ces 
polysaccharides tels quels ne sont que peu ou pas irnmunogeniques chez les 
enfants de moins de 2 ans et n'induisent pas de memoire immunitaire. 
Toutefois, ces inconvenients peuvent etre surmontes en conjuguant ces 

25 polysaccharides a une proteine porteuse. 

Par contre, le polysaccharide de A r . meningitidis groupe B n'est pas ou 
peu immunogene chez 1'homme, qu'il soit sous forme conjugude ou non. 
Ainsi, il apparait hautement souhaitable de rechercher un vaccin a l'encontre 
3 0 des meningites induites par N. meningitidis notamment du serogroupe B 
autre qu'un vaccin a base de polysaccharide. 

A cette fin, differentes proteines de la membrane externe de N. 
■ meningitidis ont deja ete proposees. n s'agit en particulier du recepteur 
3 5 membranaire de la transferrine humaine. 
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D'une maniere generate, la grands majorite des bacteries ont besoin 
de fer pour leur croissance et elles ont developpe des systemes specifiques 
d'acquisition de ce metal. En ce qui conceme notamment N. meningitidis qui 
est un pathogene strict de rhomme, le fer ne peut etre preleve qu'a partir de 
proteines humaines de transport du fer telles que la transferrine et la 
lactoferrine puisque la quantite de fer sous forme libre est negligeable chez 
rhomme (de 1'ordre de 10" 18 M), en tout cas insuffisante pour permettre la 
croissance bacterienne. 

Ainsi, N. meningitidis possede un recepteur de la transferrine bumaine 
et un recepteur de la lactoferrine humaine qui lui permettent de fixer ces 
proteines chelatrices du fer et de capter par la suite, le fer necessaire i sa 
croissance. 

Le recepteur de la transferrine de la souche M meningitidis B16B6 a 
ete purine par Schryvers et al (WO 90/12591) a partir d'un extrait 
membranaire. Cette proteine telle que purifiee apparait essentiellement 
constituee de 2 types de polypeptides : un polypeptide d'un poids moleculaire 
apparent eleve de 100 IdD et un polypeptide d'un poids moleculaire apparent 
moindre d'environ 70 KD, telles que reveles apres electrophorese sur gel de 
de polyacrylamide en presence de SDS. 

Le produit de la purification notamment mise en oeuvre par Schryvers 
est par definition arbitraire et pour les besoins de la presente demande de 
brevet, appeld recepteur de la transferrine et les polypeptides le cpnstituant, 
des sous-unites. Dans la suite du iexte, les sous-unites de poids moleculaire 
eleve et de poids moleculaire moindre sont respectivement appelees Tbpl et 
Tbp2. 

Toutefois, le procede de purification decrit par Schryvers et al ne peut 
pas etre utilise pour la production a grande dchelle du. recepteur de la 
transferrine. La preparation industrielle de ce recepteur sous forme purifiee 
passe necessairement par une etape de production a l'aide d'un systeme 
d'expression heterologue. 
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A. cette fin, l'invention se propose de fournir les fragments d'ADN 
codant pour les sous-unites du recepteur de la transferrine de N. meningitidis. 

D'autre part, depuis les travaux pionniers de Schryvers et al, on a 
decouvert qu'il existait en fait au moms 2 types de souches qui different par 
la constitution de leurs receptees de la transferrine respectifs. Ceci a ete mis 
en evidence en dtudiant des extraits membranaires de plusieurs dizaines de 
souches de AT. meningitidis d'origines variees. Ces extraits membranaires ont 
tout d'abord ete soumis a une electrophorese sui gel de polyacrylamide en 
presence de SDS, puis electrotransferes sur feuilles de nitrocellulose. Ces 
feuilles de nitrocellulose ont ete ineubees : 

a) en presence d'un antiserum de lapin dirige. contre le recepteur de la 
transferrine purifie a partir de la soucbe N. meningitidis B16B6, aussi 
appelee IM2394 ; 

b) ' en presence d'un antiserum de lapin dirige contre le r6cepteur de la. 

transferrine purifie a partir de la soucbe N. meningitidis IM2169 ; ou 

c) en presence de la transferrine humaine conjuguee a la peroxydase. . 

En ce qui concerne a) et b), la reconnaissance des sous-imites du 
r6cepteur de la transferrine est revelee par addition d'un anticorps anti- 
immunoglobulines de lapin couple a la peroxydase, puis par addition du 
substrat de cette enzyme. 

Les tableaux I et H ci-dessous indiquent le profil de certaines souches 
representatives tel qu'il apparait sur gel de polyacrylamide a 7,5 % apres 
electrophorese en presence de SDS ; les bandes sont caracterisees par leur 
poids moleculaires apparents exprimes en kilodaltons (kD) : 
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Les resultats repertories dans les 2 premieres lignes des tableaux 
montrent qu'il existe 2 types de souches : 

Le premier type (Tableau I) correspond a des souches qui possedent 
un recepteur dont les 2 sous-unites dans les conditions experimentales 
utiiisees, sont recormues par 1'antiserum anti-recepteiir IM2394 tandis que 
seule la sous-unite de haut poids moleculaire est reconnue par l'antiserum 
anti-recepteur IM2169. 

Le second type (Tableau H) correspond a des souches qui possedent 
un recepteur dont * les 2 sous-unites dans les conditions experimentales 
utiiisees, sont reconnues par l'antiserum anti-recepteur IM2169 tandis que 
seule -la sous-unite de haut poids moleculaire est reconnue par rantiserum 
anti-recepteur IM2394. 

En conseauence, il existe une diversite antigenique au niveau de la 
sous-unite de moindre poids moleculaire. Cette diversite est toutefois 
restreinte puisqu'elle se resout en 2 grands types, contrairement a ce qui est I 
suggere par Griffiths et al, FEMS Microbiol- Lett (1990) 69 : 31. 

En vertu de ces constatations, on pouvait supposer qu'un vaccin efficace 
a l'encontre de toutes les infections a N. meningitidis pourxait etre consume 
de maniere suffisante, de la sous-unite de haut poids moleculaire, quelle que 
soit la souche d'origine du recepteur, puisque cette derniere est reconnue par 
les 2 types d' antiserums. Toutefois, il semble que cela ne puisse etre le cas 
dans la mesure ou la sous-unite de haut poids mol6culaire ne serait pas 
canable d'induire la production d'anticorps de type neutralist. Seule la plus 
petite des 2 sous-unites du recepteur serait capable de remplir cette fonction. 
Puisoue cette sous-unite de moindre poids moleculaire se caractense par .une 
variation antigenique significative du premier type au deuxieme type de 
souche, un seul type de recepteur de la transferrine ne devrait pas etre 
suffisant pour vacciner centre toutes les infections a N. menmgittdis. Par 
consequent, un vaccin devra contenir au moins la sous-unit6 de momdre 
poids moleculaire de chacune des souches IM2394 et IM2169 ou de leurs 
equivalents respectifs et, de maniere optionnelle, la sous-unite de haut poids 
moleculaire d'au moins une souche de N. meningitidis. 
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Cest pourquoi 1'invention fournit un fragment d'ADN isole codant 
pour une proteine capable d'etre reconnue par un antiserum anti-rscepteur 
de la souche de N. meningitidis IM2394 ou IM2169. 

5 

Un tel fragment d'ADN peut notamment comprendre une sequence 
nucleotidique codant pour une sequence d'acides amines homologue a celle 
telle que montree : 

10 - dans l'identificateur de sequence (SEQ ID NO : 1) n° 1, commencant avec 
le residu cysteine en position 1 et finissant avec le residu glutamine en 
position 579 ; 

- dans le SEQ ID NO : 2, commencant avec le residu acide glutamique en 
15 position 1 et finissant avec le residu phenylalanine en position 884 ; 

- dans le SEQ ID NO : 3, commencant avec le residu acide glutamique en 
position 1 et finissant avec le residu phenylalanine en position 887 ; ou 



20 



dans le SEQ ID NO : 4, commencant avec le residu cysteine en position 1 
et finissant avec le residu glutamine en position 691. 



A titre indicatif, on precise qu'un fragment d'ADN selon 1'invention 
peut en outre comprendre une sequence nucleotidique additionnelle codant 
25 pour n'importe quelle autre sequence d'acides amines ; les deux sequences 
nucleotidiques consid6rees, formant un cadre ouvert de lecture de maniere a 
coder pour une proteine hybride ou un precurseur. 

De maniere avantageuse, un fragment d'ADN selon 1'invention peut 
3 0 etre selectionne parmi : 

i) Un premier fragment d'ADN" isole, ayant une sequence nucleotidique. 
codant pour une proteine ayant une sequence d'acides amines homologue 
& celle tele que montree dans le SEQ ID NO : 1, commencant avec le 
3 5 residu cysteine en position "l et finissant avec le residu glutamine en 

position 579. 
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ii) Un deuxieme fragment d'ADN isole ayant une sequence nucleotidique 
codant pour une proteine ayant une sequence d'acides amines a celle 
telle que montree dans le SEQ ID NO : 2, commencant avec le residu 
acide glutamique en position 1 et finissant avec ie residu phenylalanine 
en position 884. 

iii) Un troisieme fragment d'ADN isole ayant une sequence nucleotidique 
codant pour une proteine ayant une sequence d'acides amines a celle 
telle que montree dans le SEQ ID NO : 3, commencant avec le r6sidu 
acide glutamique en position 1 et finissant avec le residu phenylalanine 
en position 887. 

iv) Un quatrieme fragment d'ADN isole ayant une sequence nucleotidique 
codant pour une proteine ayant une sequence d'acides amines a celle 
telle que montree dans le SEQ ID NO : 4, commencant avec le residu 
cysteine en position i et finissant avec le residu glutamine en position 
691. 

Par "sequence d'acides amines homologue", on entend une sequence 
presentant un degre d'bornologie d'au moms 75 %, de maniere avantageuse 
d'au moins 80 %, de maniere preferee d'au moins 90 96, de maniere tout a 
fait preferee de 100 %, avec la sequence d'acides amines que Ton cite en 
reference. On notera que le tenne "homologue" tel que defoni inclut le cas 
particulier.de 1'identi.te. 

Le degre d'bornologie peut etre aisement calculd en alignant les 
s&piences de maniere a obtenir le degre maximal d'bornologie ; pour ce 
faire, il peut etre necessaire d'introduire artificiellement des emplacements 
vacants, comme cela est illustre dans la Figure 7. Une fois que l'alignement 
optimal est realise, le degre d'homologie est etabli en comptabiUsant toutes 
les positions dans lesquelles les acides amines des deux sequences se 
retrouvent a Tidentique, par rapport au nombre total de positions. 
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II serait fastidieux de decrire des sequences homologues autrement 
que de maniere generique, en raison du trop grand nombre de combinatory 
Ubomxne du metier connait toutefois les regies generales qui permettent de 
remplacer un acide amine par un autre sans abolir la fonction biolo gl que ou 
immunologique d'une proteine. 

Un fragment d'ADN isole et tout a fait prefere a une sequence 

nucleotidique codant pour : 

n La sous-unite Tbpl de la souche IM2394 dont la sequence en acides 
amines est telle que montree dans le SEQ ID NO : 2, commencant avec 
. le residu acide. glutamique en position 1 et finissant avec le resiau 

phenylalanine en position. 884 ; 

ii) La sous-unite Tbp2 de la souche IM2394 dont la sequence en acides 
amines est montree dans le SEQ ED NO : 1, commencant avec le residu 
cysteine en position 1 et finissant avec le residu glutamine en position 
579 ; ! 

iii) La sous-unite TDpl de la souche IM2169 dont la sequence en acides 
amines est montree dans le SEQ ID NO : 3, commencant avec le residu 
acide glutamique en position 1 et finissant avec le residu phenylalanine 

en position 887 ; ou 

iv) La sous-unite T^ P 2 de la souche IM2169 dont la sequence en acides 
amines est montree dans le SEQ ID NO : 4, commencant avec le residu 
cysteine en position 1 et finissant avec le residu glutamine en position 
691. 

Le recepteur de la transfenine etant une proteine membranaire, 
chacune de ses sous-unites est initialernent produite sous forme dun 
precurseur constitue d'un peptide signal associe en position N-terminale, a la 

forme mature. 




10 



15 



20 



25 



30 



- v - *ussi pour objet un bloc d'ADN isole 

C'est pourauoi 1 invention ^ aussi puui uuj 

• i f- - ISJ c^nuence d'acides amines presente un 
codant dout un peptide signal oont la sequence u *uiu r 
coaant pour u y y a ^ man i*re preferee de 100 %, avec la 

degre d'homologie d'au morns 80 de. manure preic 

sequence montree dans : 

i) le SEQ ID NO : 2, comment avec le residu methionine en position 

- 24 et finissant avec le residu alanine en position - 1 ; 

ii) le SEQ ID NO : 3, cornnaencant avec le residu methionine en position 

- 24 et finissant avec Le residu alanine en position - 1 ; ou 

iii) le SEQ ID NO : 4, co^n^t avec le residu methionine en position 

- 20 et finissant avec le residu alanine en position - 1. 

Un fragment d'ADN seion Invention pent etre aussi selectionne 
parmiun cinquieme, sixieme, septieme et huitieme fragments d'ADN codant 
Lpectivernent pour un precuxseux dont la sequence d acioes ammes est 
homologue a la sequence present6e dans le SEQ ID NO : 1, 2, 3 ou 4. 

Par "fragment ou bloc d'ADN isole" on entend un fragment ou bloc 
d'ADN d'origme genomique qui est i) insere dans un ™ W ou 
plasmidique ou ii) place sous le controle d'un promoteur qm hu 

heterologue. 

De plus, le bloc d'ADN codant pour le peptide signal selon Invention 
es, en outre, consider* comme isole lorsque ce bloc d'ADN est assocre a un 
fragment d'ADN codan, poux une proteine heterologue au peptide stgnal , de 
mlere a former un cadre de lecture ouvert codant pour un precurseur 

hybrid e. 

Invention conceme *nsrf une cassette d'expression qui comprend au 
moins un fragment d'ADN selon 1'invention, place sous le contto e 
dements cabbies d'ass^er son expression dans une cellule-bote 

appropriee. 
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Dans la cassette d'expression, le premier, deuxieme, troisieme ou 
quatrieme fragment d'ADN selon l'invention peut etre ou non associe a un 
bloc d'ADN codant pour un peptide signal heterology a la proteine codee 
par ledit fragment d'ADN, selon que l'on recherche ou non la s6cretion de la 
5 proteine. De preference, cette secretion sera recherchee. 

Les elements indispensables a l'expression d'un fragment d'ADN 
selon l'invention sont un promoteur de transcription, des codons de debut et 
de fin de traduction et, de maniere optionnelle, un terminates de 
10 transcription. Le promoteur peut etre constitutif ou inducible. On indique 
■ que le fragment d'ADN codant pour la sous-unite Tbp2 de la souche IM2394 
semble etre toxique pour une cellule heterologue, notamment pour E. coli. 
Dans ce cas la,il pourrait etre preferable d'utiliser. un. promoteur inducible. 

15 Des elements tels qu'un bloc d'ADN codant pour un peptide signal 

heterologue (region signal) ou un promoteur existent deja en assez grand 
nombre et sont connus de l'homme du metier. Ses competences generales lui 
permettront de choisir une region signal ou un promoteur particulier qui 
seront adaptes a la cellule-hote_dans laquelle il envisage l'expression. 

20 

Enfin, l'invention fournit un procede de fabrication d'un peptide, d'un 
polypeptide ou d'une proteine capables d'etre reconnus pax un antiserum 
anti-recepteur de la souche de N. meningitidis IM2394 ou IM2169 qui 
comprend l'acte de cultiver une celluie-hote comportant une cassette 
25 d' expression selon l'invention ; ainsi que le peptide, le polypeptide ou la 
;, ■ proteine produit par ce procede et les compositions vaccinales les contenanL 

Aux fins du procede selon l'invention, la cellule-h6te peut etre une 
cellule de mammifere, une bacterie ou une levure ; ces deux demieres etant 
3 0 preferees. La aussi, le choix d'une lignee particuliere est a la portee de 
1'homme du metier. 
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Aim de determiner l'objet de la presente invention, on precise que les 
souches de N. meningitidis IM2394 et IM2169 sont publiquernent disponibles 
aupres de la Collection Nationale de Culture des Microorganisrnes (CNCM), 
Institut Pasteur, 25 rue du Dr Roux 75015 Paris sous les numeros 
d'enregistremeni respectifs LNP N 15 11 et LNP N 1520. 

Un antiserum specifique du recepteur de la transferrine de la souche 
de K meningitidis IM2394 ou IM2169 peut etre obtenu tel que decrit dans les 
exemples ci-apres. 

Linvention est decrite plus en details dans les exemples ci-apres et 
par reference aux Figures 1 a 8. 

La Figure 1 represente la structure du phage lambda ZAP H et 
schematise la methodologie de clonage y afferent. Lambda ZAP II est un 
vecteur d'insertion equipe de sites de clonage multiples localises dans la 
partie plasmidique (pBluescript SK). Cette partie plasmidique peut etre 
excisee in vivo par co-infection avec un phage-helper et convertie en vecteur , 
plasmidique. Si une sequence codante est fusionnee en pbase a lacZ ou si un 
fragment d'ADN clone comporte un promoteur fonctionnel dans E. colt, il 
peut y avoir production d'une proteine d'interet qui pourra etre detectee a 
l'aide d'anticorps specifiques. 

La Figure 2 presente la structure du plasmide pTG1265. pTG1265 
derive du plalmide pGB2 (Churchward et al, Gene (1984) 31 : 165) comme 
suit : pGB2 est digere par EcoRI et HindlJJ, traite a la polymerase Klenow 
puis ligue au fragment Sspl - PvuII de 1 kb issu de pT7T3 184 (Mead et al, 
Protem Engineering (1986) 1 : 67 ; Pharmacia) qui comporte fl-ori, la 
sequence lacZ, les promoteurs T3 et T7 ainsi que des sites- multiples Ge 
clonage. 

La Figure 3 presente la carte genomique de la region d'ADN de la 
souche IM2394 comportant les sequences codant pour Tbpl et Tbp2 ainsi 
que les differents fragments qui ont ete clones. B = BamHl ; E = EcoRJ ; H 
= Hindi • R = EcoRV ; X = Xbal ; C = Clal. " 
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La Figure 4 presente la carte genomique de la region d'ADN de la 
souche IM2169 comportant les sequences codant pour Tbpl et Tbp2 ainsi 
que les differents fragments qui ont ete clones. C = Clal ; H = Hindi ; M = 
Mlul ; X = Xbal ; ? = position imprecise. 

5 

La Figure 5 presente la structure du plasmide paral3. para. 13 est un 
plasmide capable de se repliquer dans E. coli qui comporte le promoteur de 
• l'operon arabinose BAD (ParaB) de Salmonella typhimurium (modifie au 
niveau de la TATA box), ainsi que le gene A-aC. En aval du promoteur 
10 ParaB se trouve des sites multiples d' insertion. La serie des plasmides para 
est decrite par Cagnon et al, Prot. Eng. (1991) 4 : 843. 

La Figure 6 represente la methodologie qui a ete mise en oeuvre pour 
construiie le vecteur d' expression pTG3786. 

15 

La Figure 7 compare les sequences d'acides amines predites des sous- 
unites Topi des souches IM2394 et IM2169. Le degre d'homologie peut etre 
estime a environ 76 %. _ 1 

2 0 La Figure 8 compare les sequences d'acides amines predites des sous- 

unites Tbp2 des souches IM2394 et IM2169. Le degre d'homologie peut etre 
estime a environ 47 %. 

La. Figure 9 represente la methodologie qui a ete mise en oeuvre pour 
. 25 contruire le vecteur d' expression pTG3779. 
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EXEMPLE 1 : Clonage des fragments d'ADN codant pour les sons-unites 
Tbpl et Tbp2 du recepteur de la transferrine de la souche 
IM2394 

1A - Culture de la souche et purification du recepteur de la transferrine 

Un lyophilisat de la souche N. meningitidis IM2394 est repris dans 
environ 1 ml de bouillon Muller-Hinton (BMH, Difco). La suspension 
bacterienne est ensuite etalee sur le milieu solide Muller-Hinton contenant 
du sang cuit (5 %). 

Apres 24 hr d'incubation a 37°C dans une atmosphere contenant 10 % 
de CO^ la nappe bacterienne est recueiilie pour ensemencer 150 ml de 
BMH pH 7.2, repaxtis en 3 erlens de 250 ml. L'incubation est poursuivie 
pendant 3 hr i 37°C sous agitation. Chacune des 3 cultures ainsi realisees 
perrnet d'ensemencer 400 ml de BMH pH 7,2 supplements avec 30 jum de 
Ethylenediamine - Di (O-Hydroxyphenyl - acetic acid (EDDA, Sigma), qui 
est un agent chelatant du fer sous forme libre. 

Apres 16 hr de culture k 37°C sous agitation, les cultures sont 
controlees pour leur purete par observation au microscope apres une 
coloration de Gram. La suspension est centrifugee, le culot contenant les 
germes est pes6 et conserve a -20°C. 

La purification est mise en oeuvre essentiellement seion la m6thode 
d6crite par Schryvers et al (supra), comme suit : 

Le culot bacterien est decongele, puis remis en suspension dans 200 
ml de tampon Tris HC1 50 mM, pH 8.0 (tampon A). La suspension est 
centrifugee pendant 20 min k 15 000 xg k 4°C Le culot est i6cav6i£, puis 
remis en suspension dans du tampon A k la concentration finale de 150 g/i. 
Des fractions de 150 ml sont traitees pendant 8 min k 800 bars dans un lyseur 
de cellules travaillant sous haute pression (Rannie, module 830H). Le lysat 
cellulaire ainsi obtenu est centrifuge pendant 15 min k 4°C k 15 000 xg. Le 
surnageant est recupere, puis centrifuge pendant 25 .min a 4°C k 200 000 xg. 
Apr£s elimination du surnageant, le culot est repris dans du tampon A et 
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aprfes dosage de protdines selon Lowry, la concentration de la suspension est 
ajustee a 5 mg/ml. 

A 1,4 ml de la suspension de membranes on ajoute 1,75 mg de 
5 transferrine humaine biotinylee selon le procede d£crit par Schryvers. La 
concentration finale de la fraction membranaire est de 4 mg/ml. Le melange 
est incub£ I beure k 37°C puis centrifuge k 100 000 xg pendant 75 minutes k 
4°C. Le culot de membranes est repris par le tampon A contenant du NaCl 
0,1M et incub6 pendant 60 minutes k temperature ambiante. 

10 

Aprfes solubilisation, on ajoute a cette suspension un certain volume 
de N-Lauroyl Sarkosine k 30 % (p/v) et d'EDTA 500 mM de fa?on que les 
concentrations finales en Sarkosyl et EDTA soient de 0,5 % et 5 mM 
respectivement. Apr&s une. incubation, de 15. minutes k 37°C sous agitation, 
15 on ajoute 1 ml de resine strepavidine-agarose (Pierce) prdalablement lavee 
en tampon A- La suspension est incubee 15 minutes k temperature ambiante 
puis centrifugde k 1 000 xg pendant 10 minutes. La resine est ensuite 
conditionn6e dans une colonne et Teluat direct est 61imin6. 

2 0 La resine est lavee par 3 volumes de colonne de-tampon Tris-HCl 50 

mM pH 8.0 contenant NaCl 1M, EDTA 10 mM Sarkosyl 0,5 % (tampon B) 
puis par un volume de colonne de tampon B contenant de la guanidine-HCl 
750 mM. Le recepteur de la transferrine est ensuite elu6 par le tampon B 
contenant de la guanidine-HCl 2M. L'eluat est collecte en fractions, dans des 

2 5 tubes contenant un volume identique de Tris HC1 50 mM, pH 8.0, NaCl 1M. 

La density optique k 280 nm de Teluat est mesuree en sortie de colonne k 
l'aide d'uh detecteur UV. . . ^ 

Les fractions correspondant au pic d'elution sont recueillies, dialys6es 

3 0 contre du tampon phosphate 10 mM, pH 8,0 contenant du Sarkosyl 0,05 % et 

lyophilis6es Le lyophilisat est repris dans de Teau k une concentration 10 fois 
superieure. La solution est dialys6e une seconde fois contre du tampon 
- phosphate 50 mM pH 8,0-contenant du Sarkosyl 0,05-% (tampon C) puis la 
solution est filtree sur une membrane de porosite 0,22 ^m. 

35 _ 

Le contenu en proteines est determine et" ajustd k 1 mg/ml par 
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addition de tampon C, sous conditions aseptiques. Cette preparation est 
conserves i -7C°C 

IB - Preparation d'un antiserum specifique du recepteur dela transferrine 

E>£s lapios neo-zelandais albinos recoivent par voie sous-cutanee et 
. njuscaiaire 100 Mg du recepteur IM2394 en presence d'adjuvant complet 
T%recn& 21 jours et 42 jours apres la premiere injection, les lapins 
^ ivenl a nor£veau 100 tig du recepteur purifie mais ces fois-ci en presence 
^io^ax* incomplet de Freund. 15 jours apres la demiere injection, le 
d . s ardmaux est preleve, puis decomplemente et nitre sur une 
5&V mbrz^ de porosite 0,45 Mm. Le Sltrat est par la suite epuise par contact 
^ la soucbi IM2394 qui pour se faire, a ete cultivee au prealable en 
aVe ° ence &r sous forme libre (dans ces . conditions, la synthase du 
P ' eSe t enr de la transferrine est reprimee). Les modalites de contact sont 
1 - -0 ml du filtrat sont ajoutes a 10 10 cfu (unites fonnant des 

1 es") d ; ur^ culture de la soucbe IM2394. Uadsorpuon est poursume une 
.J* 4 c C 3DUS agitation. Les bacteries sont ensuite eliminees par , 
^trifegjtftoc- Le surnageant est recupere puis soumis a nouveau a 2 
operations d'adsorption successives comme precedemment decrit. 

1C . D6termmarion des sequences peptidiques permettant ^identification 
des fragments d'ADN. 

p^s fractions aliquotes du materiel obtenu en 1A sont sechees puis 
1 bUise-~ ca^s le tampon de LaemmJi deux fois concentr6 (Tris 65mM, 
SDS 3 %, £* c6ro1 10 % > 2-mercaptoethanol 5 %). On ajoute un volume 
d'eau equivalsnt- 

Apre* sonicadon, le materiel est chauff 6 a 90°C pendant 2 minutes, puis 
nae electrophone sur gel de polyacrylamide. Les sous-unites ainsi 
'^es sont transferees sur membrane PVDF (Immobilon, Millipore) 
riant 16 bsures a 400 mA en tampon Tris borate 50 mM, pH 8,3. Les 
unites electrotransferees sont colorees a 1'amido. black et les bandes 
corresponds a Tbpl et Tbp2 sont recuperees et soumises au 
rnicrosequencage de I'extremite N-terminale. 
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Ceci est repet6 plusieurs fois pour etablir les sequences consensus N- 
tenninales suivantes : 

TbplIM2394: EXVQAEQAQEKQLDTTQV 
Tbp2lM2394: XLJOOOCSFDLDSVEXVQXMX 

(X = acide amine non-determine). 

Afin de s6quencer des regions internes de Tbp2, la protdine sur 
membrane PVDF est soumise k digestion par la trypsine en tampon Tris 0,1 
M pH 8,2. Apres 4 heures de reaction k 37°Q les peptides sont extraits par de 
Tacide formique 70 % puis par de l'acide trifluoroacetique (TFA) 0,1 %. Ces 
peptides sont ensuite separes par HPLC 

Pour Tbp2 IM2394, les sequences internes qui ont et6 6tablies sont les 
suivantes : 



S1122 : 


NNIVLFGPD GYL.YYK 


S1125 : 


YTIQA 


S"770 : 


DGENAAGPATEXVEDAYB. ~ 


S"766 : 


XQEDSFGDVK 


S1126 : 


AAFXXXI 


S"769 : 


XNXXXMFLQGVR 


S"771 : 


TPVSDVAAR 


S"767 : 


XSPAFT 


S"762 : . 


NAIEMGGSFXFPGNAPEG(K) 


S1128 : 


XQPESQQDVSENX : 



ID - Preparation de l'ADN genomique. 

Le culot bacterien obtenu en 1A est resuspendu dans environ 25 ml de 
solution A (Tris HCL 25 mM, pH 8 contenant 50 mM de glucose et 10 mM 
d'EDTA) additibnn6e de 10 mg de" proteinase- K. Le melange est laiss6 10 
minutes a temperature ambiante. 
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Puis on ajoute 12,5 ml de solution A contenant 10 mg de lysosyme. Une 
nouvelie fois, le melange est laisse 10 minutes a temperature ambtante. On 
complete alors par 0,5 ml de sarkosyl 10 %. Le mdlange est incube 10 



minutes k -r4°C. 



3 

On ajoute ensuite 2 mg de RNAse et on laisse l'incubation se 
poursuivre 90 minutes a 37°C. UADN est purifid par quatre extractions 
phdnoliques successives. UADN present dans la demiere phase aqueuse est 
prdcipitd par I'dthanol. UADN de haul poids moleculaire est obtenu par 
10 separation sur gradient de CsCl. 



IE- Clonage. 



20 



. Une prendre banquedY^^ 
15 ZAP (Figure 1), comme suit : 

Une preparation d'ADN gdnomique a ete fragrnentde aux ultra- 
sons Les extrdmitds des fragments ainsi obtenus ont dte rendues franches par , 
txaitement a la polymerase. Les fragments ont dte methylds. Apres 
mediation, les fragments ont ete lies a des adaptateurs EcoRI, traxtds par 
EcoRI puis insdres dans le site EcoRI du phage lambda ZAP H (Stratagene). 

La souche E. coli XLl-Bhie (Stratagene) a ete infectee avec la 
banque d'ADN ainsi preparde. Les plages de lyse blanches (presence de 
phages recombinants) ont ete testees a l'aide d'un antisdrum specifique du 
rdcepteur de la transferrine de la souche IM2394 prdpard tel que decnt en 
IB Ceci a permis d'identifier deux clones lambda ZAP IL Les plasrmdes 
pBluescript contenus dans ces clones ont ete excises par co-mfectxon avec le 
phage-"helper" et ont dte appeles pBMTl et pBMT2. 

Les plasmides pBMTl et V BMT2 contiennent chacun un fragment 
EcoRI - EcoRI respectivement de 3,8 kb et 1,3 kb. lis sont presentds dans la 

Figure 3. 

Le sequence de l'insert EcoRI - EcoRI de pBNTTl a dtd mis en 
oeuvre selon la methode de shotgun (Bankier et Barrel!, Biochenustry (198.) 



25 
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B5 : 508), comme suit : 

L'insert EcoRI - EcoRI de pB2vTTl a ete purifie puis fragment6 aux 
ultra-sons. Les extr6mites des fragments ainsi obtenus ont et£ rendues 
tranches pax traitement a la T 4 polymerase. Les fragments ainsi traites ont 
et6 intxoduits dans un site du phage M13TG131 (decrit dans Kieny et al, 
Gene (1983) 2£ : 91). Environ 200 clones issus de cette preparation ont 6t6 
sequences. L* analyse de ces sequences par ordinateur a permis de 
reconstituer la sequence complete de l'insert EcoRI- EcoRI de pBMTl. 

La sequence codant pour rextremite N-terminale de Tbpl a ete 
localisee comme le montre la Figure 3. Compte tenu de la masse mol6culaire 
de Tbpl, il etait clair que.cet insert ne comportait pas le fragment d'ADN 
complet codant pour Tbpl. En amont de rextremite 5' du gene tbpl, on a mis 
en evidence un cadre de lecture ouvert mais il n'a pas ete possible 
d'identifier clairement une region codant pour l'extr6mite N-terminale du 
gene tbp2. 

Le microsequencage de regions internes de Tbp2 a done ete 
entrepris comme reporte precedemmerit en 1C. Les sequences internes qui 
etaient localisees vers l'extremite C-terminale, correspondaient bien a la 
partie 3' du cadre de lecture ouvert en amont de tbpl. 

D' autre part, l'ADN genomique de la souche IM2394, 
prealablement digere par Hindi a ete analyse par Southern blot a l'aide 
d'une. sonde d'ADN. radioactive correspondant a la zone HmcII - Hindi de 
L5 kb de l'insert de 3,8 kb de pB2vfri ; deux bandes ont ete ainsi r6velees. 
Ceci a permis de demontrer que l'insert porte par pBMTl rdsultait d'un 
assemblage artefactuel de sequences issues de deux loci distincts. La 
sequence 5' de tbp2 6tait done absente. 

La banque d'ADN genomique en lambda ZAP precedemment 
decrite a" 6te criblee de nouveau ; cette fois-ci en utilisant l'insert EcoRI - 
EcoRI de pBtvfT2 comme sonde. 29 candidats ont ete retenus parmi environ 
200 000 plages testees. Seul le plasmide d6rive pTG2749 semblait posseder 
un insert nouveau par rapport a pBMTl et pBMT2. L'insert de pTG2749 est 
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tel que represents dans la Figure 3. La region de 1'insert en amont du site 
EcoRV (region EcoRV - EcoRI) a ete sous-clonee dans M13TG131 et 
sequencee par la methode de Sanger et al s PNAS (1977) 74 : 5463 a I s aide de 
primers syntbetiques. La sequence correspondant a Textremite N-terminale 
5 de Tbp2 a ete ainsi retrouvee. 

La sequence du fragment d'ADN codant pour Tbp2 de la souche 
IM2394 est presentee dans le SEQ ID NO : 1 ainsi que la sequence d'acides 
amines correspondante. 

10 

Juste en amont de la sequence codant pour Tbp2 mature, 1'insert 
de pTG2749 comporte une region genomique distincte issue d'un autre locus. 
La aussi, il s'agit d'une artefact de clonage analogue a celui mis en evidence 
. . dans le cas de pBMTl . 

15 

Compte tenu des rearrangements observes et de 1'absence de 
sequences 3' de tbpl et 5' de tbp2 } la banque d'ADN genomique constniite en 
lambda ZAP a ete jugee inadaptee pour la poursuite du clonage. 

2 0 Une deuxieme banque d'ADN genomique a done ete construite 

dans un plasmide k faible nombre de copies, comme suit : une preparation 
d'ADN genomique a ete partiellement digeree par Sau3A. Des fragments 
d'ADN d 1 environ 4 k 6 kb ont ete purines apr&s fractionnement en gradient 
de sucrose et insdres dans le site BamHI du plasmide pTG1265. Cette 
25 preparation plasmidique a servi k transformer la souche d y E. coli 5K. On a 
estime que cette banque contenait environ 18 000 clones independants. 

Environ 50 000 clones de la deuxieme banque ont ete testes k l'aide 
d'une sonde radioactive correspondant k 1'insert EcoRI - EcoRI de pBMT2. 

3 0 Un seul clone a ete revele ; soit le plasmide pTG2759 qui poss&de un insert 

de 1,8 kb. La taille de cette insert a et6 jugee insuffisante pour contenir le 
gene complet codant pour Tbpl. 

Une troisi£me banque d'ADN a ete construite selon la methode 
3 5 decrite au paragraphe precedent a l'exception de la souche d'E. coli 5K qui a_- 
ete remplacee par la souche d'E. coli SURE (Stratagene). On a estime que 
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cette banque contenait environ 60 000 clones independants. 

Environ 70 000 clones de la troisieme banque d'ADN ont 6td testes 
k Taide d'nne sonde radioactive correspondant an fragment Mlul - Hindi de 
2,4 kb issu de l'insert de pTG2754 decrit dans l'Exemple 2 ci-aprfes et 
represents dans la Figure 4. Deux clones ont ete reveles, soient les plasmides 
pTG2780 etpTG2781, represents dans la Figure 3. 

La sequence des inserts de pTG2780 et pTG2781 a ete 6tablie selon la 
methode de Sanger. Elle est presentee dans le SEQ ID NO : 2 ainsi que la 
sequence d'acides amines correspond ante. 

Une quatrieme banque a ete construite. Le DNA genomique a ete 
digere par Sau3A et une fraction, contenant des fragments d* environ 7.kb a 
ete purifiee sur gradient' de sucrose! Cette fraction contenait un fragment 
correspondant au locus tbpl,2 car elle etait reconnue par une sonde d'ADN 
specifique de tbp2. Apr£s digestion par EcoRV etXbal et ligation k pTG1265 
digere par Smal etXbal, E coli 5K a ete transformer. Un criblage des clones . 
a l'aide d'une sonde specifique de tbp2 a ete realise. Parmi une serie de 
clones_positifs, le plasmide pTG3791 a ete etudie en particulier et s'est avere 
contenir des sequences 5' tbp2 incluant la sequence codant pour le peptide 
signal putatif de Tbp2. 

EXEMPLE 2 : Clonage des fragments d'ADN codant pour les sous-unites- 
Tbpl et Tbp2 du recepteux de la transferrine de la souche 
IM2169. 

2A- La culture de .la souche- IM2169 et la purification du recepteur de la 
transferrine ont ete effectuees dans des conditions identiques k celles 
decrites dans l'Exemple 1A. 

2B - La preparation d'un antiserum anti-recepteur de la souche IM2169 a 
ete realisee selon le protocole d6crit dans l'Exemple IB. 

2C - Les sequences peptidiques permettant Identification des fragments 
d'ADN ont ete determinees selon la methode reportee dans l'Exemple 1C. 
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Les microsequences qui ont ete etablies sont les suivantes. 

Sequence consensus de 1'extremite N-terminale de Tbpl 
ENYQ AG Q AQEKQLXXIQ VX 

Sequences des peptides internes de Tbpl : 



S1031 
S1032 
S1033 
S1034 



XLS(E,W)NAGXVLXPAX)X 
QLDTIQVK 

TAGSS GAINEIE YENXX 
YVTWENVDXXXXXX 



Sequence consensus de rextremite N-terminale de Tbp2 
SLVXAXSFDLXSV 

Sequences des peptides internes de Tbp2 : 
S1037 
S1035 
S1036 
S1040 



XXDNLSNAX 
XGDDGYDFYXGEKPX 
XQ GXYGFAMX 
XQATGHENFQYVYSGXFYK 



2D - La preparation de l'ADN genomique de la souche TM2169 a ete 
realisee selon le protocole decrit dans 1'Exemple ID. 

2E - Clonage 

Une premiere banque d'ADN genomique (fragments d'ADN Sau3A 
partiel ; pTG1265 ; E. coli 5K) a et6 construite comme pr6c6demment decrit 
dans 1'Exemple L On a estime que cette banque contenait environ 40 000 
clones independants, dont environ 70 % possedaient un insert de 4-6 kb. 

130 000 clones de cette banque ont ete testes a l'aide d'une sonde 
radioactive correspondant a Tinsert EcoRI - EcoRI de pBMT2. 42 clones ont 
ete analyses, panni lesquels 2 ont ete retenus : les plasmides pTG2753 et 
pTG2754 qui sont tels que rnontres dans la Figure 4. Les analyses en 
Southern blot ont montre que les cartes de restriction des inserts de 
pTG2753 et pTG2754 correspondaient a la carte de restriction.de l'ADN 
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genomique. 



La determination des sequences nucleotidiques et la recherche des 
regions codant pour les extremites N-terminales et les regions internes ont 
5 demontre que : 

Tinsert de 1,9 kb de pTG2753 contient la partie 3' du gene tbp2 et la 
partie 5' du gene tbpl ; et 

10 - Tinsert de pTG2754 contient la partie 3* du g£ne tbp2 et les parties 5' et 
3* du gene tbpl, en rupture de phase. 

Cette premiere banque n'a done pas permis de doner des fragments 
d\AJDN complets codant pour Tbpl ou Tbp2. . 

is- ••• ' ■• • 

Une deuxieme banque genomique a ete construite comme 
precedemment mais a partir d'ADN genomique digere par Xbal. Les 
fragments d'ADN ont ete purines apr&s fractionnement en gradient de 
sucrose. Chaque fraction (d'environ 500 a ete testee par Southern blot 

2 0 avec une sonde radioactive correspondant a Textremite 3' de tbpl (fragment 

de Tinsert de pTG2754). La fraction presentant une reaction d'hybridatioh et 
contenant des fragments d'environ 6 kb a ete clonee dans pTG1265. La 
souche E. coli 5K a ete transformee. 

25 Environ 2 400 clones de cette banque ont ete testes a Taide d'une sonde 

radioactive correspondant au fragment Hindi - Mlul de 0,6 kb issu de 
pTG2754. Cinq clones ont ete caracterises, parmi lesquels 2 ont et6 retenus : 
soient pTG3720 et pTG3721 y . tels que montres dans la Figure 4, qui 
contiennent tous deux les genes tbpl et tbp2. 

30 

Afin de completer la sequence nucleotidique codant pour Tbpl, Tinsert 
de pTG3720 a et6 sequence dans la region ou se situait la rupture de phase 
decouverte dans Tinsert de pTG2754. Ce sequengage a permis de mettre en 
-evidence que la rupture de phase de Tinsert de pTG2754 6tait due k une 

3 5 deletion de 22 bp. La sequence complete du fragment d'ADN est telle que 

montree dans le SEQ ID NO : 3. . . .-- - - 
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Le sequencage de 1'insert de pTG3720 a ete poursuivi pour etablir la 
sequence detbp2. Celle-ci a bien ete identifiee ; mais la aussi une rupture oe 

phase a ete constatee. 

5 Finalement la sequence de tb P 2 a ete determine a partir du plasmide 

pTG3721. Elle est telle que montree dans le SEQ ID NO : 4. 

F.~x~RMPLE 3 : Expression du fragment d'ADN codant pour la sous-unite 
Tbp2 de la soucbe IM2394. 

3A. Construction du vecteur d'expression pTG3786. 

Le site SphI du plasmide paral3 (Figure 5 ; Cagnon et al, Prot. Eng. 
• (1991) 4 • 843) a ete detruit par traitement a la polymerase Klenow, pour 
15 dormer le plasmide pTG3704. pTG3704 a ete linearise par coupure Ncol, 
traite a la polymerase Klenow pour rendre les extremites tranches, puis 
digere par HindJJI. 

j 

D'autre part, on a synthetise les oligonucleotides OTG4015 et ' 
2 0 OTG4016 que l'on a apparies. 

OTG4015 :5' AAATACCTATTGCCTACGGCAGCCGCTGGACTGTTATTACT 
;• CGCTGCCCAACCAGCGATGGCATGCTTT-CCCACGCGTTTTCCCA 3' 

25 OTG4016 :5 ' AGCTTGGGAAAACGCGTGGGAAAGCATGCCATCGCTGGTTGGGCA 



G 



CGAGTAATAACAGTCCAGCGGCTGCCGTAGGCAATAGGTATTT 



30 



35 



Le fragment d'ADN double brin OTG4015/OTG4016 a ete insere dans 
paral3 traite comme precedemment decrit, pour donner le plasmide 
pTG3717 dans lequel on avait reconstitue la sequence codant pour la partie 
N-terrninale du precurseur de la proteine PelB d'Envinia carotovora (Lei et 
al, J. Bact. (1987) 169 : 4379) ; Soit : 

ATG AAA TAC CTA TTG CCT ACG GCA GCC GCT GGA CTG 
Met Lys Tyr Leu Leu Pro Thr Ala Ala Ala Gly Leu 
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SphI 

TTA TTA CTC GCT GCC CAA CCA GCG ATG GCA TGCTTT 
Leu Leu Leu Ala Ala Gin Pro Ala Met Ala 

Mlul Hindi II 
CCCACGCGTTTTCCCA AGCTT 

(en souligne, aparaissent les extremites de pTG3704) 

A partir du plasmide pTG2749, on a genere pax PCR k l'aide des 
amorces OTG4011 et OTG 4012, un fragment incluant la region codant pour 
la partie N-tenninale de Tbp2, jusqu'au site Mlul interne, tel que montre 
dans la Figure 6. 

OTG4 011 : 

BarnHI SphI 

5' AAAAAGGATCC/GCA TGC CTG GGT GGC GGC GGC AGT TTC 3' 

Cys Leu Gly .... 

OTG4 012 : 

BamHI Mlul 
5 ' AAAAGGATCCG AAT GGT GTA ACG CGT AGT TTT TAT 3 ' 

Le fragment genere par PCR a ete digere par BarnHI, puis insere dans 
le site BarnHI du phage M13TG131, pour donner M13TG3724. La sequence 
de ce fragment a ete verifiee par sequengage. 

A partir de M13TG3724, on a recupere la region codant pour la partie 
N-terminale de Tbp2 sous forme d'un fragment SphI - Mlul que Ton insert 
dans pTG3717 prealablement digere par SphI et Mlul, pour donner le 
plasmide pTG3743. 

A partir du plasmide pBMTl, on a recupere la region codant pour la 
partie C-tennmale de Tbp2 sous forme d'un fragment Mlul - Ban! dont 
Textremite cohesive BanI avait ete rendue franche par traitement k la 
- polymerase Klenow. On a insere ce fragment dans pTG3743 prealablement 
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digere par Hindlll^ traite a la polymerase Klenow et finalement digere par 
MluL On obtient ainsi le plasmide pTG3786. 

3B. Production de la sous-unit^ Tbp2, 

E. coli MC1061 (Casadaban & Cohen, J. Mol. Biol. (1980) 13£ : 179) 
est transformee par pTG3786 puis mise en culture k 37°C, en milieu LB 
supplements avec 2 g/1 de glycerol. A la culture est en phase exponentielle, 
on ajoute 0,2 g/1 d'axabinose. L'incubation a ete poursuivie durant 6 hr 
supplementaires. L'expression a ete observee moins d'une heure apr&s 
l'addition d'arabinose. 

L'electrophorfese sur gel d'acrylamide d'un echantillon du lysat 
cellulaire total a mis en evidence la presence d ? une proteine d ? environ 70 kD 
qui est capable de fixer la transferrine humaine marquee k la peroxydase. 

EXEMPLE 4 : Expression du fragment d'AJDN codant pour la sous-unite 
tbpl de la souche IM2169. 

4A- Construction du vecteur d'expression pTG37796. 

Un fragment synthetique constitue des oligonucleotides OTG4038 et 
OTG4039 prealablement apparies, a ete insere dans le plasmide pTG3704 
digere ^zxNcoI et Hindlll, generant ainsi le plasmide pTG3756. 

OTG4038 : 

5 ' CATGGCTGCAGGRACCACGCGTGAATTCCCCGGGTCTAGA 3 ' 
OTG4 03 9 : 

5' AGCTTCTAGACCCGGGGAATTCACGCGTGGTACCTGCAGC 3' 

Apartir du plasmide- pTG2754, on a genere par PCR k 1'aide des 
amorces OTG4037 et OTG4014 un fragment incluant la region codant pour 
Textremite N-terminale du precurseur de Tbpl jusqu'au site MluL 
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5' G TTTCCCGGATCCGC ATG CAA CAG CAA CAT TTG TTC CGA TTA 3 

. BamHI SphI 

Met Gin Gin Gin. - - 



10 



15 



20 



OTG4 014 : 

5' AAAAGGATCCGGGGTCGTAACGCGTCAGGTCGCGG 3' 
BamHI MluX 

Ce fragment PCR a ete digere par BamHI et clone dans le site BamHI 
de M13TG131 pour generer M13TG3738. La sequence de ce fragment a ete 
verifiee. 

M13TG3738 a ensuite ete linearise -par SphI, traite -k. la T4 DNA 
polymerase pour rendre les extremes franches, puis digere par Mini afin 
d'isoler le fragment porteur de la region codant pour 1'extremite N-ternnnale 
du precurseur de Tbp 1. 

i 

Ce fragment a ete insere dans pTG3756 digere pax Ncol, traite a la T4 ' 
DNA polymerase puis digdre par Mhd, pour generer le plasmide pTG3778. 
La sequence de la jonction NcoF/SphF a ete verifiee. 

Le fragment Mlul - Xbal de pTG3720 codant pour la majeure partie de 
H>pl (3'tbpJ) a ete insere dans le plasmide P TG3778. Le plasmide final amsi 
obtenu est le plasmide pTG3779. 

4B. Production de la sous-unite" Tbpl. 

E. coli MC1061 a et6 transforme par pTG3779 puis mise en culture a 
37°C en milieu LB. A la culture en phase exponential e, on a ajout6 0,2 g/l 
d'arabinose. L'incubation a ete poursuivie durant 4 beures. 



. - X'electrophorese sur gel d'acrylamide d'un echantillon du lysat 
:: ^f^gKellulaixe total a mis en evidence la presence d'une proteine d'environ 100 
.' ss'^Rd'qui est capable de fixer la transferrine humaine marquee Ua_peroxydase. 
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SEP ID NO : 1 



Sequence de l'ADN genomique de la souche de N. meningitidis IM2394 
codant pour la sous unite Top2 et sequence proteique deduite. En gras sont 
indiques le peptide signal et le site Mlul 



ATG AAC AAT CCA TTG 15 

Met Asn Ash Pro Leu 

-20 



60 



105 



130 



GTA AAT CAG GCT GCT ATG GTG CTG CCT GTG ^TT TTG TTG AGT GCT 
Val Asa Glu Ala Ala Met Val Leu Pro Val Phe Leu Leu Ser Ala 
" 15 -10 - 5 _ 1 

TGT CTG GGT GGC GGC GGC AGT TTC GAT TTG GAC AGC GTG GAA ACC 
Cys Leu Gly Gly Gly Gly Ser Phe Asp Leu Asd Ser Val Glu Thr 

5 10 15 

GTG ^CAA GAT ATG CAC TCC AAA CCT AAG TAT GAG GAT GAA AAA AGC 
Val Gin Asp Met His Ser Lys Pro Lys Tyr Glu Astd Glu Lys Se- 
20 25 ' 30 

CAC- CCT GAA AGC CAA CAG GAT GTA TCG GAA AAC AGC GGC GCG GCT 195 
Gin Pro Glu Ser Gin Gin Asp Val Ser Glu Asn Ser Gly Ala Ala 
35 40 45 

TAT GGC TTT GCA GTA AAA CTA CCT CGC CGG AAT GCA CAT TTT AA^ 240 
Tyr Gly Phe Ala Val Lys Leu Pro Arg Arg Asn Ala His Phe A.sn 
50 55 60 

CCT AAA TAT AAG GAA AAG CAC AAA' CCA TTG GGT TCA ATG GAT TGG 285 
' ro L * s G ^ Lys His Lys Pro Leu Gly Ser Met Asd TriD 

65 • 70 ' 75 

AAA AAA CTG CAA AGA GGA GAA CCA AAT AGT TTT AGT GAG AGG GAT 330 
Lys Lys Leu Gin Arg Gly Glu Pro Asn Ser Phe Ser Glu Arg Asp 
80 .85 90 

GAA TTG GAA AAA AAA CGG GGT AGT TCT GAA CTT ATT GAA TCA AAA 375 
Glu Leu Glu Lys Lys Arg Gly Ser Ser Glu Leu lie Glu Ser Lys 
95 100 105 

TGG GAA GAT GGG CAA AGT CGT GTA GTT GGT TAT ACA AAT TTC ACT 420 
-rp Glu Asp Gly Gin Ser Arg Val Val Gly Tyr Thr Asn Phe Thr 
110 115 120 

TAT GTC CGT TCG GGA TAT GTT TAG CTT AAT AAA AAT AAT ATT GAT 4 65 

Tyr Val Arg Ser Gly Tyr Val Tyr Leu Asn Lys Asn Asn He Asp 
- * 25 130 135 

ATT AAG AAT AAT ATA GTT CTT TTT GGA CCT GAC GGA TAT CTT TAC 510 
xle Lys Asn Asn lie Val Leu Phe Gly Pro Asd Gly Tyr Leu Tyr 
"0 145 " !50 
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*~-sr- rTr CCA TCG GAA AAG ATA 
TAT AAA GGG AAA BA CCT TCC AAG GAG CTG CCA TC ^ 
Tyr Lys Gly Lys Glu Pro Ser Lye Glu Leu Pro jr ^ 

ACT TAT AAA GGT ACT TGG GAT TAT GTT ACT GAT OCT ATG GAA AAA 
Thr Tyr Lys Gly Thr Trp Asp Tyx V £i Thr Asp Ala He ^ 
170 17is 

CAA AGG TTT GAA GGA TTG GOT AGT GCA GCA GGA GGA GAT AAA TCG 
Gin Arg Phe Glu Gly Leu Gly Ser Ala Ala Gly <-xy . x ^ 

X 85 

!S s ss s s s SS Si s i 1= s - ss s 
ss s is s S si s ss s i s ss s= ss 1 

GAG GTT GAT TTT TCT GAT AAA ACA ATA AAG GGC ACA CTT TAT CGT 
Glu Val Asp Phe Ser Asp bys Thr lie Lys Giy j. ^ 
230 • 23b 

i£ KS « X !S S! £S 5S i2 SJ ^ 51 - - 1 

245 250 

ACT ACO CGT TAC ACC ATT CAA GCA ACT CTT CAC GGC AAC CGT TTC 

Thr Thr Arg Tyr Thr lie Gin Ala THr Leu nxs wy ^ 

260 26b 

„^„ --j. rAT iv> G GT GCA ACA AAT GGA AGT 

AAA GGT AAG GCG TTG GCG GCA GAT AAA fata- 

Lys Gly Lys Ala Leu Ala Ala Asp Lys Gly Al. Tnr A_n / ^ 

X 55 55 S = SS = £ = = « - - = 1 

290 293 

GGG CCG AAA GGC GAG GAA CTT GCC GGT AAA TTC TTG AGC AAC CAC 
Gly Pro Lys Gly Glu Glu Leu Ala Gly Lys - ne i,eu ^ 
305 . 31U 

j£S £ SS S S - 52 SS S i| SS 5i SE S H 

^.o- rrr rPT GCA ACG GAA ACC GTG ATA GAT 
GAT GGG GAA AAC GCG GC^ GGG CCT GCA AC ^ ^ ^ 

Asr> Gly Glu Asn Ala Ale Gly Pro ax* 345 

^„ r>T,r- rar TTT AAG AAA GAG CAA ATA GAC 

S2 SS 5 iS 5S SS SS SS JS 5. ^. «- «. 

350 3 " 
AGT TTT GGA GAT GTG AAA AAG CTG CTG GTT GAC GGA GTG GAG CTT 
-ser Phe Gly Asp VaL Lys Lys Leu lbu vax a . y ^ 
365 J/u 

^7>r- ra~r AAT AAG GCG GCA TTT CAG CAC GAG 

S lIS 2S SS E SS SS SS ph. «» *.■«.« 

- 380 



555 



600 



645 



690 



735 



780 



825 



870 



915 



960 



1005 



1050 



1095 



1140 



1185 



1230 



385 



390 
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ATT GAG CAA AAC GGC GTG AAG GCA ACG GTG TGT TGT TCC AAC TTG 127 5 

lie Glu Gin Asn Gly Val Lys Ala Thr Val Cvs Cvs Ser Asn Leu 
395 400 " " 405 

GAT TAG ATG AGT TTT GGG AAG CTG TCA AAA GAA AAT AAA GAC GAT 1320 
Asp Tyr Met Ser Phe Gly Lys Leu Ser Lys Gku Asn Lys Asp Asp 
410 415 ' 420 

ATG TTC CTG CAA GGT GTC CGC ACT CCA GTA TCC GAT GTG GCG GCA 1365 
Met Phe Leu Gin Gly Val Arg Thr; Pro Val Ser Asr> Val Ala Ala * 
425 430 " 435 

AGG ACG GAG GCA AAC GCC AAA TAT CGC GGT ACT TGG TAC GGA TAT 1410 
Arg Thr Glu Ala Lys Tyr Arg Gly Thr Gly Thr Trx> Tyr Gly Tyr 
440 445 " 450 

ATT GCC AAC GGC ACA AGC TGG AGC GGC GAA GCC TCC AAT CAG GAA 1455 
He Ala Asn Gly Thr Ser Trp Ser Gly Glu Ala Ser Asn Gin Glu 
455 460 465 

GGT GGT AAT AGG GCA GAG TTT GAC GTG GAT TTT TCC ACT AAA AAA ISOO 
Gly Gly Asn Arg Ala Glu Phe Asp Val Astd Phe Ser Thr Lys Lys 
470 ' 475 480 

ATC AGT GGC ACA CTG ACG GCA AAA GAC CGT ACG TCT CCT GCG TTT 1545 
He Ser Gly Thr Leu Thr Ala Lys Asp Arg Thr Ser Pro Ala Phe 
485 490 495 

ACT ATT ACT GCC ATG ATT AAG GAC AAC GGT TTT TCA GGT GTG GCG 1590 
Thr lie Thr Ala Met Tie Lys Asp Asn Gly Phe Ser Gly Val Ala 
500 505 510 

AAA ACC GGT GAA AAC GGC TTT GCG CTG GAT CCG CAA AAT ACC GGA 163 5 

Lys Thr Gly Glu Asn Gly Phe Ala Leu Aso Pro Gin Asn Thr Gly 
515 520 525 

AAT TCC CAC TAT ACG CAT ATT GAA GCC ACT GTA TCC GGC GGT TTC 1680 
Asn Ser His Tyr Thx His He Glu Ala Thr Val Ser Gly Gly Phe 
530 535 " 540 

TAC GGC AAA AAC GCC ATC GAG ATG GGC GGA TCG TTC TCA TTT CCG 1725 
Tyr Gly Lys Asn Ala Xle Glu Met Gly Gly Ser Phe Ser Phe Pro 
545 550 555 

GGA AAT GCA CCA GAG GGA AAA CAA GAA AAA GCA TCG GTG GTA TTC 1770 
Gly Asn Ala Pro Glu Gly Lys Gin Glu Lvs Ala Ser Val Val Phe 
560 565 570 

GGT GCG AAA CGC CAA CAG CTT GTG CAA TAA GCACGGCT 1808 
Gly Ala Lys Arg Gin Gin Leu Val Gin 
575 
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SKO TP NO : 2 



Sequence de l'ADN genomique de la souche de N. meningitidis IM2394 
codant pour leprecurseur de la sous-unite Tbpl du recepteur de la transferrine 
et sequence prot6ique d&iuite. Le peptide signal est indiqud en caracferes gras. 



CTTCCGATG CCGTCTGAAA GCGAAGATTA GGGAAACACT 40 

ATG CAA CAG CAA CAT TTG TTC CGA TTA AAT ATT TTA TGC CTG TCT 85 
Met Gin Gin Gin His Leu Phe Arg Leu Asa He Leu Cys Leu Ser 
—24 -20 -15 -10 

TTA ATG ACC GCG CTG CCC GTT TAT GCA GAA AAT GTG CAA GCC GAA 130 
Leu Met Tnr Ala Leu Pro Val Tyr Ala Glu Asn Val Gin Ala Glu 
-5 -11 5 

CAA GCA CAG GAA AAA CAG TTG . GAT ACC ATA CAG GTA AAA GCC AAA 175 
Gin Ala Gin Glu Lys .Gin Leu Asp Thr He Gin Val Lys Ala Lys : 
10 ' 15 * 20 

AAA CAG AAA ACC CGC CGC GAT AAC GAA GTA ACC GGG CTG GGC AAG 220 
Lys Gin Lys Thr Arg Arg Asp Asn Glu Val Thr Gly Leu Gly Lys 
25 30 35 

TTG GTC AAG TCT TCC GAT ACG CTA AGT AAA GAA CAG GTT TTG AAT 2 65 

Leu Val Lvs Ser Ser Astd Thr Leu Ser Lys Glu Gin Val Leu Asn 
40 45 50 

ATC CGA GAC CTG ACC CGT TAT GAT CCG GGT ATT GCC GTG GTC GAA 310 
lie Arg Asp Leu Thr Arg Tyr Asp Pro Gly He Ala Val Val Glu 
55 SO 65 

CAG GGT CGG GGC GCA AGT TCC GGC TAT TCA ATA CGC GGC ATG GAT 355 
Gin Gly Arg Gly Ala Ser Ser Gly Tyr Ser lie Arg Gly Met Asp 
70 75 80 



AAA AAC CGC GTT TCC TTA ACG GTA GAC GGC GTT TCG CAA ATA CAG 
Lvs Asn Axg Val Ser Leu Thr Val Asp Gly Val Ser Gin He Gin 
* 85 90 95 



GCA TTG GCA GGT TCG GTC GCA TTT CAA ACC AAA ACC GCA GCC GAC 
Ala Leu Ala Gly Ser Val Ala Phe Gin Thr Lys Thr Ala Ala Asp 
145 150 155 



400 



TCC TAC ACC GCG CAG GCG GCA. TTG GGT GGG ACG AGC- ACG GCG GGT 44 5 

Ser Tyr Thr Ala Gin Ala Ala Leu Gly Gly Thr Arg Thr Ala Gly 
100 105 HO 

AGC AGC GGC GCA ATC AAT GAA ATC GAG TAT GAA AAC GTC AAG GCC 490 

Ser Ser Gly Ala He Asn Glu lie Glu Tyr Glu Asn Val Lys Ala 
115 . 120 125 

GTT GAA ATC AGC AAG GGT TCG AAT TCA TCA GAA TAC GGA AAC GGC 53 5 

Val Glu He Ser Lvs Gly Ser Asn Ser Ser Glu Tyr Gly Asn Gly 
130 " 135 140 



580 
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ATT 
lie 



TAT 
Tyr 

GGA 
Gly 

CGG 
Arg 



CAG 
Gin 



ATC GGA 
lie Gly 

TCG GGA 
Ser Gly 

CGC AGC 
Arg Ser 

GGT CGG 
Gly Arg 



AGC TTC 
Ser Phe 



GGC 
Gly 

GGA 
Gly 

AAA 
Lvs 



AAC 
Asn 



CTG 
Leu 



AGT CAG 
Ser Gin 



TAT GCG 
Tyr Ala 

GAT GAG 
Asp Glu 

CGC TTA 
Arg Leu 

TTC CGA 
Phe Arg 



GCC 
Ala 



ACT 
Thr 



CTG 
Leu 



CTG 
Leu 



GGT 
Gly 

GGG 
Gly 



GTT CTC 
Val Leu 



GTT CCT 
Val Pro 



GAG GGA 
Glu Gly 
160 

AAA GAC 
Lys Asp 
175 

GGC GGC 
Gly Gly 
190 

GAA ATC 
Glu lie 
205 

AAC CGG 
Asn Arg 
220 

TAC AGA 
Tyr Arg 
235 

GCC TGT 
Ala Cys 
250 

CGC AAA 
Arg Lys 
265 

CTT GCG 
Leu Ala 
280 

CCG GGT 
Pro Gly 
295 

GAA CGT 
Glu Arg 
310 

GCC TAT 
Ala Tyr 
325 



AAA CAG TGG 
Lys Gin Trp 



CAT GCC CTG 
His Ala Leu 



GCG GAA GCC 
Ala Glu Ala 



CAT GCG CAT 
His Ala His 



CTG GTG TTG 
Leu Val Leu 



TAT TTC ATT 
Tyr Phe Tie 



AAA AAC AAG 
Lys Asn Lys 



ACC GTC AGC 
Thr Val Ser 



AAC CCG CTT 
Asn -Pro Leu 



TGG CAT TTG 
Trp His Leu 

ACG CAG CAG 
Thr Gin Gin 



TTT ACC AGT 
Phe Thr Ser 



GGC ATT 
Glv He 
16*5 

ACG CAA 
Thr Gin 
ISO 

CTC CTT 
Leu Leu 
195 



CAG AGT 
Gin Ser 



TCC CTT 
Ser Leu 



ATT TAT 
lie Tyr 



AAA GGT 
Lys Gly 



TTT GTT 
Phe Val 



ACC GGC 
Thr Gly 



GTC GAA 
Val Glu 



CTT GGC 
Leu Gly 
340 

CAG GGA 
Gin Gly 
355 

GTG TTT 
Val Phe 
370 

TAT GTT 
Tyr -Val 
385 



AAA TAT TCG 
Lys Tyr Ser 



AAA GAT 
Lys Asp 
210 

GAC GAG 
AST3 Glu 
225 

GTC GAA 
Val Glu 
240 

CTG "AAA 
Leu Lys 
255 

ACG CAG 
Thr Gin 
270 

GAG TAT 
Glu Tyr 
285 

GAC AAC 
Asp Asn 
3O0 

ACC TTT 
Thr Phe 
315 

GAA GAT 
Glu Asp 
330 

GGC GAT 
Gly Asp 
345 



GCC GGC 
Ala Gly 



GAC AAG 
Aso Lvs 



GAA GAA 
Glu Glu 



GAA GAT 
Glu As 13 



GAT TAT 
Asp Tyr 



GGC AGC 
Glv Ser 



CGC CAT 
Arg Kls 



AAA ACT GCC 
Lvs Thr Ala 
170 

GCG CTT GCC 
Ala Leu Ala 
185 

ACT AAA CGG 
Thr Lys Arg 
200 

AAG GGT GTG 
Lys Gly Val 
215 

AAG GAG GGT 
Lys Glu Gly 
230 

TGC CAC AAT 
Cys His Asn 
245 

GCC TCG GTC 
Ala Ser Val 
260 

ACC GGC TCC 
Thr Gly Ser 
275 

CAA TCA TGG 
Gin Ser Trp 
290 

TAT GTC GGA 
Tvr Val Gly 
305 



GAG GGC AGT 
Glu Gly Ser 

TAT GAT GAA 
Tyr Asp Glu 

TAC CAT AAT 
Tyr Kls Asn 



ACA TTG 
Thr Leu 
3 60 

CGC CAT 
Arc His 
375 

GCT GAT 
Ala Asp 
390 



GAT ACA 
Aso Thr 



TAT GTA 
Tyr Val 

AAT AAG 
Asn Lys 

CAG GGT 
Gin Gly 

ACT AAA 
Thr Lys- 

AAG GAT 
Lys Asp 



CGG GAT ATG 
Arg Aso Met 
320 

CCC GGT TCG 
Pro Gly Ser 
335 

GCA GAA AGG 
Ala Glu Arg 
350 

ATC GGT TAC 
He Gly Tyr 
365 

AAC CGC TAC 
Asn- Arg Tyr 
380 

ACC TGG GCC 
Thr Trp Ala 

• * 395 



625 



.70 



715 



760 



805 



850 



895 



940 



985 



1030 



1075 



1120 



1165 



1210 



1255 



1300 
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GAT TAC GCC CGA CTT TCT TAT GAC CGG CAA GGT ATA GAT TTG GAC 
Asp Tvr Ala Arg Leu Ser Tvr Asp Arg Gin Gly He Asp Leu Asp 
" " 405 410 



400 



415 



460 



.475 



490 



505 



AGG GTG TCT ATC C-GC AAG ACC ACG GTC AAT ACA TCG CCG ATA TGC 
Arg Val Ser He Gly Lys Thr Thr Val Asn Thr Ser Pro He Cys 
525 530 



520 



1345 



AAC CGT TTG CAG CAG ACG CAT TGC TCT CAC GAC GGT TCG GAT AAA 13.0 
Asn Arg Leu Gin Gin Thr His Cys Ser Kls Asp Gly Ser Asp Lys 

420 425 



1435 



AAT TGC CGT CCC GAC GGC AAT AAA CCG TAT TCT TTC TAT AAA TCC 
Asn Cys Axg Pro Asp Gly Asn Lys Pro Tyr Ser Phe Tyr Lys Ser 
430 435 440 

GAC CGG ATG ATT TAT GAA GAA *AGC CGA AAC CTG TTC CAA GCA GTA 1480 
Asp Aro Met He Tyr Glu Glu Ser Arg Asn Leu Phe Gin Ala Val 
P y 445 450 455 

TTT AAA AAG GCA TTT GAT ACG GCC AAA ATC CGT CAC AAT TTG AGT 1525 
Phe Lys Lys Ala Phe Asp Thr Ala Lys He Arg Kis Asn Leu Ser 



ATC AAT CTA GGG TAC GAC CGC TTT AAG TCG CAA TTG TCC CAC AGC 157 0 

He Asn Leu Gly Tvr Asp Axg Phe Lys Ser Gin Leu Ser His Ser 
- — ** " 48.00 485 



GAT TAT TAT CTT CAA AAC GCA GTT CAG GCA TAT GAT TTG ATA ACC 1615 
Asp Tyr Tyr Leu Gin Asn Ala Val Gin Ala Tyr Asp Leu He Thr 

495 500 



CCG AAA AAG CCT CCG TTT CCC AAC GGA AGC AAA GAC AAC CCG TAT 1660 
Pro Lys Lys Pro Pro Phe Pro Asn Gly Ser Lys Asp Asn Pro Tyr 
510 515 



1705 



CGT TTC GGC AAT AAC ACC TAT ACA GAC TGC ACA CCG AGG AAT ATC 17 3 0 

Arg Phe Gly Asn Asn Thr Tyr Thx Asp Cys Thr Pro Arg Asn He 
535 540 545 

") GGC GGC AAC GGT TAT TAT GCA GCC GTT CAA GAC AAT GTC CGT TTG 1795 

Gly Gly Asn Gly Tyr Tyr Ala Ala Val Gin Asp Asn Val Axg Leu 
550 555 560 

GGC AGG TGG GCG GAT GTC GGA GCA GGC ATA CGT TAC GAT TAC CGC 1840 
Gly Ara'Trp Ala Asp . Val Gly Ala Gly He Arg Tyr Asp . Tyr Arg 
. ' 565 570 . 575 

AGC ACG. CAT TCG GAA GAT AAG AGT GTC TCT ACC GGC ACT CAC CGC 1885 
Ser Thr His Ser Glu Asp Lys Ser Val Ser Thr Gly Thr His Axg 
580 585 . 590 

AAC CTT TCT TGG AAC GCG GGC GTA GTC CTC AAA CCT TTC ACC TGG 1930 
Asn Leu Ser Trp Asn Ala Gly Val Val Leu Lys Pro Phe Thr Trp 
595 600 605 

ATG GAT TTG ACT TAT CGC GCT TCT ACG GGC TTC CGT CTG CCG TCG 1975 
Met Asd Leu Thr Tyr Arg Ala Ser Thr Gly Phe Arg Leu Pro Ser 
610 615 620 

TTT GCC GAA ATG TAT GGC TGG AGA GCC GGG GAG TCT TTG AAA ACG 2020 
Phe Ala Glu Met Tyr Gly Trp Arg Ala Gly Glu Ser Leu Lys Thr 
625 630 635 
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GGC GGC AAC GGT TAT TAT GCA GCC GTT CAA G AC AAT GTC CGT TTG 1795 

Gly Giy Asn Glv Tvr Tyr Ala Ala Val Gin Asp Asn Val Arg Leu 
550 555 560 

GGC AGG TGG GCG GAT- GTC GGA GCA GGC ATA CGT TAC GAT TAC CGC 1840 
Gly Aro Trn Ala Asr> Val Gly Ala Gly lie Arc Tyr Asp Tyr Arg 
565 570 575 

AGC ACG CAT TCG GAA GAT AAG AGT GTC TCT ACC GGC ACT CAC CGC 1885 
Ser Thr His Ser Glu Asp Lys Ser Val Ser Thr Gly Thr His Arg 
580 585 590 

AAC CTT TCT TGG AAC GCG GGC GTA GTC CTC AAA CCT TTC ACC TGG 1930 
Asn Leu Ser Trr> Asn Ala Gly Val Val Leu Lys Pro Phe Thr Trp 
595 600 605 

ATG GAT TTG ACT TAT CGC GCT TCT ACG GGC TTC CGT CTG CCG TCG 1975 
Met Asp Leu Thr Tyr Arg Ala Ser Thr Gly Phe Arg Leu Pro Ser 
610 "* 615 620 

TTT GCC GAA ATG TAT GGC TGG AG A GCC GGG GAG TCT TTG AAA ACG 2020 
Phe Ala Glu Met Tyr Gly Trr> Arg Ala Gly Glu Ser Leu Lys Thr 
625 " 630 635 

TTG GAT CTG AAA CCG GAA AAA TCC TTT AAT AG A GAG GCA GGT ATT 206 5 

Leu Astd Leu Lys Pro Glu Lys Ser Phe Asn Arg Glu Ala Gly lie 
640 645 650 

GTA TTT AAA GGG GAC TTC GGC AAT TTG GAA GCC AGC TAT TTC AAC 2110 
Val Phe Lys Gly Asr> Phe Gly Asn Leu Glu Ala Ser Tyr Phe Asn 
655 " 660 665 

AAT GCC TAT CGC GAC CTG ATT GCA TTC GGT TAT GAA ACC CGA ACT 2155 
Asn Ala Tyr Arc Aso Leu lie A.la Phe Gly Tyr Glu Thr Arg Thr 
670 * 675 680 

CAA AAC GGG CAA ACT TCG GCT TCT GGC GAC CCC GGA TAC CGA AAT 2200 
Gin Asn Gly Gin Thr: Ser Ala Ser Gly Asp Pro Gly Tyr Arg Asn 
685 690 695 

GCC CAA AAT GCA CGG ATA GCC GGT A.TC AAT ATT TTG GGT AAA ATC 224 5 

Ala Gin Asn Ala Aro He Ala Gly He Asn He Leu Gly Lys He 
700 705 710 

GAT TGG CAC GGC GTA TGG GGC GGG TTG CCG GAC GGG TTG TAT TCC 2290 
Asr> Trr> His Glv Val Trp Glv Gly Leu Pro Asp Gly Leu Tyr Ser 
715 " 720 725 

ACG CTT GCC TAT AAC CGT ATC AAG GTC AAA GAT GCC GAT ATA CGC 233 5 

Thr Leu Ala Tyr Asn Arg He Lys Val Lys Asp Ala Asp He Arg 
730 735 740 

GCC GAC AGG ACG TTT GTA ACT TCA TAT CTC TTT GAT GCC GTC CAA 2380 
Ala Asd Arg Thr Phe Val Thr Ser Tyr Leu Phe Asp Ala Val Gin 
745 750 755 

CCT TCA CGA TAT~ GTA TTG GGT TTG GGT TAC GAC CAT "CCT GAC GGA 2425 
Pro Ser Arg Tyr Val Leu Gly Leu Gly Tyr Asp His Pro Asp Gly 
760 765 770 

ATA TGG GGC -ATG AAT ACG ATG TTT ACT TAT TC.C AAG . GCA AAA , TCT 247 0 

He Trp Gly He Asn Thr Met Phe Thr Tyr Ser Lys Ala Lys Ser 
775 780 785 
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AC A TTT AGC TIG GAA ATG AAG TTT TAA ACGTCCAAAC GCCGCAAATG 2787 
Thr Phe Ser Leu Glu Met Lys Phe 
880 



CCGTCTGAAA GGCT 



2801 
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<?-FD TP NO : 3 



Ohiet • Sequence de l'ADN genomique de la souche de N. meningitidis IM2169 

0bjE • Sr^ur 1, precursor de la sous-unite Tbpl et sequence protege oeduite. 

Le peptide signal est indique en caracteres gras. 

ATCAAGAATA AGGCTTCAGA 20 
CGGCATCGCT CCTTCCGATA CCGTCTGAAA GCGAAGATTA GGGAAACATT 70 

Si g£ sr. as s: s ss si K «i s S 55 s s 

2S SS 52 S S £ S S SiJE ?5 Si S SS 

as £ =r„ si si ss s s a ss - s: s £ 



10 



AAA CAG AAA ACC CGC CGC GAT AAC GAA GTA ACC GGT CTG GGC AAA 
Lvs Gin Lys Thr Arg Arg Asp Asn Glu Val Th.. Gly Leu Gly i-y 

25 30 
TTG GTC AAA ACC GCC GAC ACC CTC AGC AAG GAA CAG GTA CTC GAT 
Leu Val Lys Thr Ala Asp Thr Leu Ser ,ys Glu Gin Val Asp 

40 4:5 

ATC CGC GAC CTG ACC- CGT TAC GAC CCC GGC ATC GCC GTG GTC GAA 
lie Arg Asp Leu Thr Arg Tyr Asp Pro Gly He Ala Val Val Gin 
55 60 

CAG GGG CGC GGC GCA AGT TCG GGC TAC TCG ATA CGC GGT ATG GAC 
Gin olv Arg Gly Ala Ser Ser Gly Tyr Ser He Arg Gly Met Asp 
70 75 

as m ss s sjs ;s is ss s s ss s s; 

85 90 

TCC TAC ACC GCG CAG GCG GCA TTG GGC GGG ACG AGG ACG GCG GGC 
Ser Tyr Thr Ala Gin Ala Ala Leu Gly Gly Thr *rg Thr Ala o_y 
1O0 105 

iE i£ Si iS i£ 2S Si - - - - - i?i S 

115 I 20 

^ „_ rno TrA Mir TCG GTC GAA CAA GGC AGC GGC 

GTC GAA ATC AGC AAA GGC TCA AAC y 
Val -Glu He Ser- Lys Gly Ser Asn -Ser Val Glu Gin GXy ± 
130 135 



115 



160 



205 



250 



295 



340 



385 



430 



475 



520 



565 
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CCA TTO GCG GGT TCG GTC GCA TXT CAA ACC AAA ACC GCC GAC GAT 
Ala Leu Ala Gly Ser Val Ala Phe Gin iyr i,ys inr . 

145 1=° 
GTT ATC GCC GAA GGC AGG CAG TGG GGC ATT CAG ACT AAA ACC CCC 
val He Gly Glu Gly Arg Gin Trp Gly us Gin Ser i*ye 

160 165 
TAT TCC GGC AAA AAC CGG GGG CTT ACC CAA TCC ATC GCG CTG GCG 
Tyr ser Gly Lys Asn Axg Gly Leu Thr Gin Ser lie Axa 

175 180 

SS S S S? S5 S - S S S £ SS S 

190 

£ E-SS S5 S SS S S5 Si £ S SS S S v-S 



20S 



CAG AGC TXT AAC AGG CTG GTC CCC GTT CAA CAC ACC AGO GAA XAC 
Gin Ser Phe. Asn Arg Val Pro . ya. oj.u « . 230 

. 220 : 22;> 

rrc TAT TTC ATC GTT GAA GAT GAA TGC GAA GGC AAA AAT TAC GAA 
J£ Sr Phe iS Sal Glu Asp Glu Cys Glu Gly Lys A.n Tyr Glu 

235 240 

iS s: iJi ^ s £i £ S !S - SS 51 »| - 



250 



~ ss is v-s s s s; 25 - s? s is pj 



265 



CTC GCC «. CO =TT TC* TXC J» >=C CU TCG »« =» ™ ™ 

Leu Ala Asp Pro Leu Ser Tyr Glu Ser Arg _ ^ 

280 . 28b 
CCG GGT TTT CGT TTT GAA AAC AAA CGG CAC TAC ATC GGC GGC ATA 
Pro Gly Phe Arg Phe Glu Asn Lys Arg H^s Tyr lie cxy y 

295 300 

s sk ss is as si ?s - ss ss 2; s f o ss. 

310 313 
_ . ^ ~ rT ^ TTT GAT GCA AAT TCA AAA CAG 

S J?i SS 2S iS X vli |2 -p *-» «« sn 



325 33° 



OCG GGT TCT TTG CCC CCC AAC GGC AAA TAC GCG GGC AAC CAC AAA 
Ala Gly Ser Leu Pro Gly Asn Gly Lys Tyr Aia y ^ 



340 3* s 



TAC GGC GGA CTG TTT ACC AAC GGC GAA AAC GGT GCG CTG GTG GGC 
Tyr Gly Gly Leu Phe Thr Asn Gly Glu Asn Gly Ala Leu vai y 
355 350 

GCG GAA TAC GGT ACG GGC GTG TTT TAC GAC G.AG _ACG CAC ACC AAA 
Ala Glu Tyr Gly Thr Gly Val Phe Tyr Asp Glu Thr His Thr Ly 
370 375 



600 



645 



690 



735 



780 



825 



870 



915 



960 



1005 



1050 



1095 



1140 



1185 



1230 



127 5 




2692592 



AGC CGC TAC GGT TTG GAA TAT GTC TAT ACC AAT GCC GAT AAA GAC 13 20 

Ser Arg Tyr Giy Leu Giu Tyr Val Tvr Thr Asn Ala Asp Lys Asp 
385 390 395 

ACT TGG GCG GAT TAT- GCC CGC CTC TCT TAC GAC CGG- CAG GGC ATC 1365 
Thr Trp Ala Asd Tvr Ala Arg Leu Ser Tyr Asp Arg Gin Gly lie 
400 405 410 

GGT TTG GAC AAT CAT TTT CAG CAG ACG CAC TGT TCT GCC GAC GGT 1410 
Glv Leu Asn Asn His Phe Gin Gin Thr Ris Cys Ser; Ala Asp Gly 
415 420 425 

TCG GAC AAA TAT TGC CGC CCG AGT GCC GAC AAG CCG TTT TCC TAT 1455 
Ser Asp Lys Tyr Cys Arg Pro Ser Ala Asp Lys Pro Phe Ser Tyr 
430 ' ' 435 440 

TAC AAA TCC GAC CGC GTG ATT TAC GGG GAA AGC CAC AGG CTC TTG 1500 
Tyr Lys Ser Asp Arg Val lie Tyr Gly Glu Ser His Arg Leu Leu 
445 450 455 

CAG GCG GCA TTC AAA AAA TCC TTC GAT ACC GCC AAA ATC CGC CAC 15 4 5 

Gin Ala Ala Phe Lys Lys Ser Phe Asp Thr Ala Lys lie Arg His 
460 ~ " 465 470 

AAC CTG AGC GTG AAT CTC GGG TTT GAC CGC TTT GAC TCT AAT CTC 1590 
Asn Leu Ser Val Asn Leu Glv Phe Asp Arg Phe Asp Ser Asn Leu 
475 " 480 485 

CGC CAT CAG GAT TAT TAT TAT CAA CAT GCC AAC CGC GCC TAT TCG 163 5 

Arg His Gin A so Tyr Tyr Tyr Gin His Ala Asn Arg Ala Tyr Ser 
490 495 500 

TCG AAA ACG CCC CCT AAA ACC GCC AAC CCC AAC GGC GAC AAG AGC 1680 
Ser Lys Thr Pro Pro Lys Thr Ala Asn Pro Asn Gly Asp Lys Ser 
505 "* 510 515 

AAA CCC TAT TGG GTC AGC ATA GGC GGG GGA AAT GTG GTT ACG GGG 1725 
Lys Pro Tyr Trr> Val Ser lie Gly Gly Gly Asn Val Val Thr Gly 
520 525 530 

CAA ATC TGC CTC TTT GGC AAC AAT ACT TAT ACG GAC TGC ACG CCG 17 7 0 

Gin lie Cys Leu Phe Giy Asn Asn Thr Tyr Thr Asp Cys Thr Pro 
535 540 545 

CGC AGC ATC AAC GGC AAA AGC TAT TAC GCG GCA GTT CGG GAC AAT 1815 
Arg Ser Xle Asn Gly Lys Ser Tyr Tyr Ala Ala Val Arg Asp Asn 
550 555 560 

GTC CGT TTG GGC AGG TGG GCG GAT GTC GGC GCG GGG TTG CGC TAC 1860 
Val Arg Leu Gly Arg Trp Ala Asp Val Gly Ala Gly Leu Arg Tyr 
565 ~ ■ 570 575 

GAC TAC CGC AGC ACG CAT TCG GAC GAC GGC AGC GTT TCC ACC GGC 1905 
Asp Tyr Arg Ser Thr His Ser Asp Asp Gly Ser Val Ser Thr Gly 
580 585 590 

ACG CAC CGC ACC CTG TCC TGG -AAC- GCC GGC ATC GTC CTC AAA CCT 1950 
Thr His Arg Thr Leu Ser Trp Asn Ala Gly lie Val Leu Lys Pro 
595 6O0 605 

GCC GAC TGG CTG GAT TTG ACT TAC CGC ACT TCA ACC, GGC TTC CGC 1995 
Ala Asp Trp Leu Asp Leu Thr* Tyr Arg Thr Ser Thr Gly Phe Arg 
610 * 61S 620 
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SFO ID NO : 4 



Objet • Sequence de l'ADN genomique de la souche de N. meningitidis IM2169 
codant pour le precurseur de la sous-unite Tbp2 et sequence proteique deduite. 
Le peptide signal est indique en caxactere gxas. 



ATTTGTTAA AAATAAATAA AATAATAATC CTTATCATTC TTTAATTGAA TTGGGTTTAT 

ATG AAC AAT CCA TTG GTA AAT CAG GCT GCT ATG GTG CTG CCT GTG 
SJS J£ Pro Leu va As. Gin Ala Ala Met Val L*u Pro Val 

-20 ~ 15 

TTT TTG TTG ACT GCC TGT CTG GGC GGC GGC GGC AGT TTC GAT CTT 
51 III sll Ala Cys Leu Gly Cly Gly Cly Ser Phe Asp Leu 

-5 -11. 5 

GAT TCT GTC GAT ACC- GAA GCC CCG CCT CCC GCG CCA AAG TAT CAA 
Isl III vlt Asp Thr Clu Ala Pro Arg Pro Ala Pro uys ?yr "Gin 
15 20 



GAT GTT TCT TCC GAA AAA CCG CAA GCC CAA AAA GAC CAA GGC GGA 
Asp vll Ser Ser Glu Lys Pro Gin Ala Gin Lys Asp Gin Oly Cly 



30 



TAC GGT TTT GCG ATG AGG TTG AAA CGG AGG AAT TGG TAT CCG GGG 
Tyr Gly Phe Ala Met Arg Leu Lys Arg Arg Asn Trp Tyr Pro Cxy 

45 50 

GCA GAA GAA AGC GAG GTT AAA CTG AAC GAG AGT GAT TGG GAG GCG 
Ala Glu Giu Ser Glu Val Lys Leu Asn Glu Ser Asp Trp Glu Ala 
60 65 

ACG GGA TTG CCG ACA AAA CCC AAG GAA CTT CCT AAA CGG CAA AAA 
Thr Gly Leu Pro Thr Lys Pro Lys Glu Leu Pro Lys Arg Gin Lys 
75 80 

TCG GTT ATT GAA AAA GTA GAA ACA GAC GGC GAC AGC GAT ATT TAT 
12 Val III ££ Lys val Glu Thr Asp Gly Asp Ser Asp He Tyr 

TCT TCC CCC TAT CTC ACA CCA TCA AAC CAT CAA AAC GGC AGC GCT 
III s2 Pro Tyr Leu Thr Pro Ser Asn His Gin Asn Gly Ser Ala 
105 110 

GGC AAC GGT GTA AAT CAA CCT AAA AAT CAG GCA ACA GGT CAC GAA 
Gly Asn Gly Val Asn Gin Pro Lys Asn Gin Ala Thr Gly His Glu 
120 125 

AAT TTC CAA TAT GTT TAT TCC GGT TGG TTT TAT AAA CAT GCA GCG 
Sn HI Gin Ty"r Val Tyr Ser Gly Trp Phe Tyr Lys Hxs Ala Axa 

135 14U - 

AGT GAA AAA GAT TTC AGT AAC AAA AAA ATT AAG TCA GGC GAC GAT 
Ser Glu Lys Asp Phe Ser Asn Lys Lys lie Lye Ser Gly Asp Asp 
150 1=>* 



59 
104 

149 

194 

239 

284 

329 

374 

419 

464 

509 



554 



599 
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GGT TAT ATC TTC TAT CAC GGT GAA AAA CCT TCC CGA CAA CTT CCT 
Gly Tvr lie Phe Tyr His Gly Clu Lys Pro Ser Arg Gin Leu Pro 

GCT TCT GGA AAA GTT ATC TAC AAA GGT GTG TGG CAT TTT GTA ACC 
Ala Ser Gly Lys Val lie Tyr Lys Gly Val Trp d« Pne V~l Thr 
180 185 

GAT ACA AAA AAG GGT CAA GAT TTT CGT GAA ATT ATC CAG CCT TCA 
Asp Thr Lys Lys Gly Gin Asp Phe Arg Glu lie lie Gin Pro Ser 



19S 



AAA AAA CAA GGC GAC AGG TAT AGC GGA TTT TCT GGT GAT GGC AGC 
Jyt Gin Gly A f p Arg Tyr Ser Gly Phe Ser Gly Asp Gly Ser 



210 



GAA GAA TAT TCC AAC AAA AAC GAA TCC ACG CTG AAA GAT GAT CAC 
Glu Glu Tyr Ser Asn Lys Asn Glu Ser Thr Leu Lys Asp Asp His 



225 



rar GGT TAT GGT TTT ACC TCG AAT TTA GAA GTG GAT TTC GGC AAT 
Glu Gly iyr tly III Thr Ser,Asn Leu Glu Val Asp Phe Gly Asn 



240 



AAG AAA TTG ACG GGT AAA TTA ATA CGC AAT AAT GCG AGC CTA AAT 
Lys Lys Leu Thr Gly Lys Leu He Arg Asn Asn Ala Ser Leu Asn 



255 



AAT AAT ACT AAT AAT GAC AAA CAT ACC ACC CAA TAC TAC AGC CTT 
En ?£ En Asn Asp Lys His Thr Thr Gin Tyr Tyr Ser Leu 

270 273 

GAT GCA CAA ATA ACA GGC AAC CGC TTC AAC GGC ACG GCA ACG GCA 
Asd Ala Gin He Thr Gly Asn Arg Phe Asn Gly Tnr Ala Th. Ala 
285 290 

ACT GAC AAA AAA GAG AAT GAA ACC AAA CTA CAT CCC TTT GTT TCC 
Thr Asp Lys Lys Glu Asn Glu Thr Lys Leu Hxs Pro Phe Val Ser 

300 305 

GAC TCG -TCT TCT TTG AGC GGC GGC TTT TTC GGC CCC- CAG GGT GAG 
Asp ie2 12 Ser Leu Ser Gly Gly Phe Phe Gly Pro Gin Gly Glu 
315 320 

GAA TTG GGT TTC CGC TTT TTG AGC GAC GAT CAA AAA GTT GCC GTT 
Glu Leu Glv Phe Arg Phe Leu Ser Asp Asp Gin ^ys Val Ala Val 
330 ■ 335 

GTC GGC AGC GCG AAA ACC AAA GAC AAA CTG GAA AAT GGC GCG GCG 
Val Gly Ser Ala Lys Thr Lys Asp Lys Leu Glu Asn Gly Ala Al. 



345 



GCT TCA GGC AGC ACA GGT GCG GCA GCA TCG GGC GGT GCG GCA GGC 
Ala Ser Gly Ser Thr Gly Ala Ala Ala Ser Gly Gly Ala Ala Gly 
360 365 

ACG TCG TCT GAA AAC ACT AAG. CTG. ACC ACG GTT TTG GAT GCG GTT 
Thr Ser Ser clu Asn Ser Lys Leu Thr Thr Val Leu Asp Ala Val 
375 380 

GAA TTG ACA CTA AAC GAC AAG AAA ATC AAA AAT CTC GAC AAC TTC 
Glu Leu Thr -Leu Asn Asp -Lys Lys lie Lys Aan Leu Asp Asn Phe 
390 395 



644 



689 



734 



779 



824 



869 



914 



959 



1004 



1049 



1094 



1139 



1184 



1229 



L274 



1319 
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AGC AAT GCC OCC CAA CTC GTT GTC GAC COC ATT ATG ATT CCG CTC 
Ser Asn Ala Ala Gin Leu Val Val Asp Gly He Met -le F-o 
405 410 

CTG CCC AAG GAT TCC GAA AGC GGG AAC ACT CAG GCA GAT AAA GGT 
Leu Pro Lys Asp Ser Clu Ser Gly Asn Tnr Gin Ala *b P i.y- y 

420 425 
AAA AAC GGC GGA ACA GAA TTT ACC CGC AAA TTT GAA CAC ACG CCG 

Lye Aen Gly Gly Thr Clu Phe Thr Arg Lys Phe Glu His Tnr 
435 440 



Si 52 i£ £1 Si 2S S Si S SS S S5 iS i£ 5J 

450 455 

S Si £ S S 5SI iS S SS ^ J£ SI SS Si £ 
£ £ £ Si 5 Si !5 cy» s i - ss £ s 

480 485 

AAA • TAC GGA. ATG TTG ACG CGC AAA AAC AGC AAG T.CC GCG . ATG CAG 
Lys Tyr Gly Met Leu Thr Arg Lys Asn Ser Lys Ser Ala Me. Gin 

GCA GGA GGA AAC ACT ACT CAA GCT GAT GCT Thr Glu Gin Val 

Ala Gly Gly Asn Ser Ser Gin Ala Asp Ala Lys Thr Glu Gin Val 
510 51S> 

CAA CAA AGT ATG TTC CTC CAA GGC GAG CGT ACC GAT GAA AAA GAG 
Clu Si sir Phe Leu Gin Gly Glu Arg Thr Asp Glu Lys Glu 

525 530 

ATT CCA ACC GAC CAA AAC GTC GTT TAT CGG GGC- TCI TGG TAC GGG 
He Pro Thr Asp Gin Asn Val Val Tyr Arg Gly Ser T.p Tyr Gly 
540 545 

CAT ATT GCC AAC GGC ACA AGC TGG AGC GGC AAT GCT TCT GAT AAA 
His He Ala Asn Gly Thr Ser Trp Ser Gly Asn Ala Ser Asp Lys 
555 560 

GAG GGC GGC AAC AGG GCG GAA TTT ACT GTC- AAT TTT GCC GAT AAA 
Glu Gly Gly Asn Arg Ala Glu Phe Thr Val Asn Phe Ala Asp Lys 
570 . = 75 

AAA ATT ACC GGC AAG TTA ACC GCT GAA AAC AGG CAG GCG CAA ACC 
lVs lie Thr Gly Lys Leu Thr Ala Glu Asn Axg Gin Ala Gin Thr 

585 590 

TTT ACC ATT GAG GGA ATG ATT CAG GGC AAC GGC TTT GAA GGT ACG 
Phe Thr" lie Glu C-ly Met He Gin Gly Asn Gly Phe Glu Gly Th 
600 605 

GCG AAA ACT GCT GAG TCA GGT TTT GAT CTC GAT CAA AAA AAT ACC 
Ala Lys Thr Ala Glu Ser Gly Phe Asp Leu Asp Gin Lys Asn Thr 
615 620 

ACC CGC ACG CCT AAG GCA TAT ATC ACA GAT GCC AAG GTA AAG GGC 
Thr Arg Thr Pro Lys Ala Tyr He Thr Asp Ala Lys Val Lys Gly 

OJ J 



1364 



1409 



1454 



1499 



1544 



1589 



1634 . 



1679 



1724 



1769 



1814 



1859 



1904 



1949 



1994 



2039 



630 
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GGT TTT TAC GGG CCT AAA GCC GAA GAG TTG GGC GGA TGG TTT GCC 2084 

Gly Phe Tyr Gly Pro Lys Ala Glu Glu Leu Gly Gly Trp ?he Ala 

645 650 " 655 

TAT CCG GGC GAT AAA CAA ACG GAA AAG GCA AC A GCT ACA TCC AGC 212 9 

Tyr Pro Gly Asp Lys Gin Thr Glu Lys Ala Thr Ala Thr Ser Ser 

660 " 665 670 

GAT GGA AAT TCA GCA AGC AGC GCG ACC GTG GTA TTC GGT GCG AAA 2174 

Asp Gly Asn Ser Ala Ser Ser Ala Thr Val Val Phe Gly Ala Lys 

675 680 685 

CGC CAA CAG CCT GTG CAA TAA GCACGGTTGC CGAACAATCA AG AATAAGG C 2225 
Arg Gin Gin Pro Val Gin 
690 

TTCAG 2230 
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IRp.vendi catio ns 

1 Un fra.rn.nt d'ADN isole codant pour un peptide, un polypeptide ou ' 
le p capaoles d'etre — par«rn antrum an^ecepteur 
de la traraferrine de la souche de M m^Au, IM2394 ou IM2169. 

2 Un fravmen, d'ADN selon la revendication 1, qui comprend une 
H q u!nc°e nucleotide codant pour une sequence d'actdes attunes 
bomologue a celle telle que montree : 

. dans le SEQ ID NO : 1, conusant avec le residu cysteine en position 
1 et finissant avec le residu glutatrdne en posttton 579 , 

. dans le SEQ ID NO : 2, conrmen S an« avec 1= residu acide glutanuque 
exposition ! et finissant avec le residu phenylalanine en posttton 884 , 

. dans le SEQ ID NO : 3, commencant avec le residu acide glutarnique 
en position X et finissant avec le residu phenylalantne en postnon 887 , ^ 

ou 

. dans 1= SEQ ID NO : 4, commencant avec le residu cysteine en position 
1 et finissant avec le residu gmtamine enposttton 691. 

, Un frasment d'ADN selon la revendication 2, qui comprend une 
^ueTnucleotidique codant pour une sequence d'acides atntnes telie 

que.montree : 

. dans le SEQ ID NO : 1, commencant avec le residu cysteine en position 
1 et finissant avec le residu glutamine en posttton 579 , 

. dans le SEQ ID NO : 2, comment avec le residu acide glutarnique 
edition 1 et finissant avec le residu phenylalanine en posttton 884 , 

. dans le SEQ ID NO : 3, commencant avec le residu acide glutarnique 
e^idon 1 e. finissant avec le residu phenylalantne en posttton 887 , 

ou 
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- dans le SEQ ID NO : 4, commengant avec le residu cysteine en position 
1 et finissant avec le residu glutamine en position 691. 

Un fragment d'ADN selon la revendication 2, qui a une sequence 
nucleotidique codant pour une proteine ayant une sequence d'acides 
amines homoiogue k celle telle que montree : 

- dans le SEQ ID NO : 1, commengant avec le residu cysteine en position 
1 et finissant avec le residu glutamine en position 579 ; 

- dans le SEQ ID NO : 2, commengant avec le residu acide glutamique 
en position 1 et finissant avec le residu phenylalanine en position 884 ; 

- dans le SEQ ID NO : 3, commengant avec le residu acide glutamique 
en position 1 et finissant avec le residu phenylalanine en position 887 ; 
ou 

- dans le SEQ ID NO : 4, commengant avec le residu cysteine en position 
1 et finissant avec le residu glutamine en position 691. 

Un fragment d'ADN selon la revendication 4 , qui a une sequence 
nucleotidique codant pour : 

i) la sous-unite Tbpl de la souche IM2394 dont la sequence en acides 
amines est montree dans le SEQ ID NO : '2, commengant avec le 
residu acide glutamique en position 1 et finissant avec le residu 
phenylalanine en position 884 ; 

ii) la sous-unite Tbp2 de la souche IM2394 dont la sequence en acides 
amines est montree dans le SEQ ID NO : 1, commengant avec le 
residu cysteine en position 1 et finissant avec le residu glutamine en 
position 579 ; 

iii) la sous-unite Tbpl de la souche IM2169 dont la sequence en acides 
amines est montree dans le SEQ ID NO : 3, commengant avec le 
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residu acide glutamique en position 1 et finissant avec le residu 
phenylalanine en position 887 ; ou 

iv) la sous-unite Tbp2 de la souche IM2169 dont la sequence en acides 
amines est montree dans le SEQ ID NO : 4, commencant avec le 
residu cysteine en position 1 et Snissant avec le residu glutaroine en 
position 691. 

Un fragment d'ADN selon la revendication 2, qui a une sequence 
nucleotidique codant pour un precurseur ayant une sequence d'acides 
amines b-omologue a celle telle que montree : 

dans le SEQ . ID NO : 1, commengant avec le residu Methionine en 
. ' position -20 et finissant avec le residu glutamine en position 579 ; 

- dans le SEQ ID NO : 2, commengant avec le residu methionine en 
position -24 et finissant avec le residu phenylalanine en position 884 ; 

- dans le SEQ ID NO : 3, commen?ant avec le residu methionine en 
position -24 et finissant avec le residu phenylalanine en position 887 ; 
ou 

- dans le SEQ ID NO : 4, commengant avec le residu methionine en 
position -20 et finissant avec le residu glutamine en position 691. 

Un fragment d'ADN selon L'une des revendications 1 et 2, 
qui a une sequence nucleotidique codant pour .: 

i) Le precurseur de la sous-unite Tbpl de la souche IM2394 dont la 
sequence en acides amines est montree dans le SEQ ID NO : 2, 
commencant avec le residu methionine en position -24 et finissant 
avec le residu phenylalanine en position 884 ; 

ii) Le precurseur de la sous-unite Tbp2 de la souche IM2394 dont la 
seauence en acides amines est montree dans le SEQ ID NO : 1, 
commencant avec le residu methionine en position -20 et finissant 
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avec le residu glutamine en position 579 ; 

iii) Le precurseur de la sous-unite Tbpl de la souche IM2169 dont la 
sequence en acides amines est montree dans le SEQ ID NO : 3, 
commengant avec Je residu methionine en position -24 et finissant 
avec le residu phenylalanine en position 887 ; ou 

■•iv) Le precurseur de la sous-unite Tbp2 de la souche IM2169 dont la 
sequence en acides amines est montree dans le SEQ ID NO : 4, 
commengant avec le residu methionine en position -20 et finissant 
avec le residu glutamine en position 691. 

8. Une cassette d'expression destinee a la production d'une proteine 
capable d'etre reconnue par un antiserum anti-recepteur de la 
transferrine de la souche de N. meningitidis IM2394 ou IM2169, qui 
comprend un fragment d'ADN selon 1'une des revendications 1 a 7, place 
sous le controle des elements necessaires a son expression. 

9. Une cellule-hote transformee par une cassette d'expression selon la 
revendication 8. 

10. Un procede de production d'une proteine capable d'etre reconnue par un 
antiserum anti-recepteur de la transferrine de la souche de 
meningitidis IM2394 ou IM2169, qui comprend Facte de cultiver une 
cellule-hote selon la revendication 9 . 

11. Un bloc d'ADN isole codant pour un peptide signal ayant une sequence 
d'acides amines homologue a celle telle que montree dans : 

le SEQ ED NO : 2, commengant avec le residu methionine en 
position - 24 et finissant avec le residu en position - 1. 

le SEQ ID NO : 3, commengant avec le residu methionine en 
position - 24 et finissant avec le'residii alanine -en position - 1 ; et 



le SEQ ID NO : 4, commen?ant avec le residu methionine en 
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position - 20 et finissant avec le residu alanine en position - L 

12. Un bloc d'AJDN isole codant pour un peptide signal ayant une sequence 
d'acides amines telle que montree dans : 

le SEQ ID NO : 2, commengant avec le residu methionine- en 
position - 24 et finissant avec le residu en position - 1 ; 

le SEQ ID NO : 3, commengant avec le residu methionine en 
position - 24 et finissant avec le residu alanine en position - 1 ; et 

' - , le SEQ ID NO : 4, commengant avec le residu methionine en 
position- 20 et finissant avec lerfisidu alanine en position- L . 



c 



2692592 



2/10' 

EcoRl.1 



EodRI.202 
Sst 1,210 
Kpn 1 215 
Sma 1.217 
Xma 1.217 
BamHl.223 
|Xba 1.228 

Sal 1,233 
Acc 1.233 
Hinc 11.233 
Pst 1,239 
Sphl.244 
Hind 111,249 
Pvu 11,369 . 
Fspl.419 
Bgl 1,430 

Dralll ,664 

f1-ori \ - Noel. 767 




BspH 1,977 



FIG. 2 



3/10 



2692592 




4r\ 



5/ib" 



2692592 



4276,Hindl 
4124, Pvul 

3871 ,B Q n 
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rbpl-239 4 
Lbpl-2169 



MCK^K^Rl-NxLCLSLXTAI-PV^^^ 

Tbpl-2394 LVKSSDTLSXZG^NIRDLTR^ 
Tbpl " 21 ° 9 L^KTADTLS^QyXDIHDLTRYDPGI^ 

£k P i~^!~ sy - a Q^s~ t * ta gssgaj^ 

Tbpl -21 69 S YT AQAAI*GGT RT AG SSGA X NZIZ YZi^VXA VHI SXGSNS VEQG SGAJLAG SVA-FOTXTADD 



Tbpl -239 4 
Tbpl -21 69 



Tbpl -2394 
Tbpl -21 69 



Tbp 1-2394 SlVRJL^ANFLZYCSCS^FP^G *>XDN-R^^ 

Tbpl -21 69 ?**^^PLSYESRS«T.rRPGFR^ 

Tbpl -2394 
Tbpl -21 69 

Tbpl -2394 ASKDTWAQYARI.SYDRC^IDIX>NRI^TO^ 

tbp 1-2169 t?!^y^ Y ^ R ^ SYDR OG IG ^ 

T 5 p1 ~ 2394 * r^foavtkka^ota:<zrhki.sini.gydrf:<sols:^ 

T^pl -2169 H^^QAAFXXSFDTAXIRHNLSVNI^ 

Zw P ! ~??!o GSKD^ YRVSIGKTTV>rrS?ICRFGNN 

Tbpl -2 i 69 GDKSXPYVV r SXGGG^^^/VTGQICIJ^GNNTYTOC^ 
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Tb o \ - 2 3 9 4 AAPGRN'YTFSI-SHXP 
Tbpl -21 69 — AAPGRKYTFSLZKXT 



- = acide amin£ idencique 
. =changemenc conservacif 
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~bo2-2 394 C^3GCCSFDLDS^TVCC>CnS:<PKYZDE:<SO-?rSQQDVSZNSC^YGFAV:<I.P?.?.NAHF 

Tbp2-21 69 C1CGGG3FDLDSVOT-EAPRPAPXY0DVS3ZXP0AOXD OG - G YG F AMR1.XR RN — W 

Tbp2-2 39 4 NP K YX £ XKK? 1 G 3 MD V/XKLO - RGZ ? N S F 3 E RD E — LZXXR — G 55Z-LXXSXVTED 

Tbp2-2 1 69 Y ? G AZ Z 3 ZVXZN E 3DVFATGL PTX? KZI_ P K RQK S V I ZKVETDGO S D I Y S S P YE T ? S N'HQN 

Tbo2-2 394 G Q — 5SVVGYT>TrTYVRSGYVVXNX-NNIDIXKNXVX.?G?0GYI.YYXGKE?SK 

Tbp2-2 i 69 - GSAGNGV>?O?KN0ATGKZNFQYVYSGVFYXKAASEXDrSN*>QCZKSGDDGYXFYHGi-X?SR 

Tbo2- 239 4 EL--5EXZTYXGTVDYVTDA>G:X0RF-EG — G3AAGGDKSGALS ALZZGVT.RNOAZAS- - 

Tbp2-2169 qlpaSGXVI^GVVKFVTDTXXGODFREXXO 

T b p2-?394 5GH'^DFGKTSZFFVOFSDKTIXGTLYRNNRXTONNSE^^C0IXTTRYTIQAT^.HGNRFXGX 

Tbp2 -21 69 DOKZGYGFTSNLHVOFGNKXLTGKI.IR^^NASLN^^^^^NNDXKTTO«SLDAOXTCNRFNGT 

Tbo2-239^ AJLAADXGAZNGS-KPFISDSDSLEGGFYGPXGZZI^GCT 

Tbp2- 21 69 ATATDXXENZTXZh^rV3DS33LSGGFFGPQGEZLGFRFLSDro 

Tbo2-2 394 FN AAGPATZ TVIDAYRITGZZFXXZQXDSFGDVXXLLVDGVZ 

Tbp2 -2 1 69 GAAASG5TGAAASGGAAGT35ENSXLTTVLOAVeLTLNDXXXKNLDNFSNAAOLVVOGIM 



Tbo2-2394 LSLLPSEGNXAA EQH^XZ 

Tbp2-21 69 r ?L r.oKDSF3GNTOADKGXNC^TFFTRXFEHTPHSDXXDAOAGTOTNGAOTASNTAGCTN 

"< 

TbD2-2^94 VCC3NLDYMSFGXI.3XFN-X DCMFLQGVRTP 

Tbp2-2l69 G XTX7 YZVZVCCS N T LN YZX YGMZZRXN S X 5 AMQ AG G N* 5 SO AD AXT ZQVZQ SHE LOG RT D 

-rw o2 -2 394 vSDVAARTEANAXYRGTVYGYXANGTSWSGZASNOEGGNRA£FDVDFSTXXISGTI*CAi^ 

Tbp 2-2169 EKE XP — TDQtfVVYRGSVYGHXANGTSWSGNASDXSGGNRAEFTVHFADXXXTGX^ * A^N 

^o2-2394 RTSPAFTXTAKXXDNGFSGVAXTCEMGFAXJDPONTGNSHYTKX - EATVSGGFYGXNAIZM 

Tbp2-21 69 RQA<yrFTXEGHXOGvNGFXGTAXTAZSGFDLiX}XNTTRTPKAYXTDAXVXGGFYG? 

Tbo2 - 2 39 4 GGSFSFPGNAPEGXOE KASWTGAKRQOLVQ 

Tbo2-21 69 GGVFAYPGDKQTEKATATS5DGNSAS5ATWTGAXRGQPVQ 



= acice amin£ idencique 
= chanqemenc conservacif 
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